Apache Hiveを使用しているのは誰ですか?

質問者:Bouabid Wimberger |最終更新日:2020年3月3日
カテゴリ:趣味と興味の養蜂
4.1 / 5 (119ビュー。17投票)
現在ApacheHiveを使用している企業
会社名Webサイト収益(USD)
ウェルズ・ファーゴwellsfargo.com $ 1,000,000,000以上
アップルapple.com $ 1,000,000,000以上
シティciti.com $ 1,000,000,000以上
ウォルマートwalmart.com $ 1,000,000,000以上

これに関して、誰がハイブを使用しますか?

Apache Hiveは、通常データアナリストによってデプロイされるHadoopコンポーネントです。 Apache Pigも同じ目的でデプロイできますが、 Hiveは研究者やプログラマーによってより多く使用されています。これはオープンソースのデータウェアハウジングシステムであり、Hadoopに保存されている巨大なデータセットのクエリと分析にのみ使用されます。

さらに、ハイブはまだ使用されていますか? Hiveは2008年8月にオープンソース化され、それ以来、データ処理のニーズのために多くのHadoopユーザーによって使用および調査されてきました。

このようにして、Apache Hiveを作成したのは誰ですか?

Apache Hiveは、最初はFacebookによって開発されましたが、NetflixやFinancial Industry Regulatory Authority(FINRA)などの他の企業によって使用および開発されています。

なぜハイブが必要なのですか?

Apache Hiveを使用すると、開発者はアドホック要件のために複雑なHadoopMapReduceジョブを作成する必要がなくなります。したがって、ハイブはデータの要約、分析、およびクエリを提供します。 Hiveは非常に高速でスケーラブルです。 Hiveは、ユーザーがSQLクエリを送信できるインターフェイスを提供することにより、MapReduceの複雑さを軽減します。

39関連する質問の回答が見つかりました

Hadoopなしでハイブを実行できますか?

Hadoopはコアのようなものであり、 Hiveにはそこからいくつかのライブラリが必要です。この答えを更新古くありません:ハイブとスパークにはHDFSのサポートを持っていることはもはや必要です。 Hiveにhdfsとmap / reduce必要なので、それら必要になります。しかし、その要点は次のとおりです。ハイブにHadoopとm / r必要なので、ある程度対処する必要あります。

ハイブはデータベースですか?

Hiveは、Hadoopエコシステム上にあるETLおよびデータウェアハウスツールであり、構造化および半構造化データの処理に使用されます。 Hiveは、Hadoopエコシステムに存在するデータベースであり、DDLおよびDML操作を実行し、データのクエリと処理を改善するためのHQLなどの柔軟なクエリ言語を提供します。

ハイブは思い出ですか?

Hiveはユーザー、グループ、およびロールにアクセス権を提供しますが、Sparkはまだそのようなサポートを提供していません。 Sparkのインメモリ処理はほぼリアルタイムの分析を提供しますが、 Hiveは主にETL、バッチジョブに使用されます。

なぜハイブはデータウェアハウスなのですか?

Hiveは、Hadoopで構造化データを処理するためのデータウェアハウスインフラストラクチャツールです。ビッグデータを要約するためにHadoopの上にあり、クエリと分析を簡単にします。スキーマをデータベースに格納し、データをHDFSに処理するため、データウェアハウスツールと呼ばれています。 OLAP用に設計されています。

ハイブはSQLですか、それともNoSQLですか?

HiveNoSQLデータベースですか? Apache Hiveは読み取り専用のSQLダイアレクトを提供するため、その意味で、リレーショナルデータベースの非標準のSQL風のインターフェイスを公開しますが、OLAPタイプはOLTPタイプではありません。複数のデータソース、通常はビッグデータスペースの分散システムをサポートします。

Hiveデータはどこに保存されますか?

2つの答え。 Hiveデータは、Hadoop互換ファイルシステム(S3、HDFS、またはその他の互換性のあるファイルシステム)のいずれかに保存されます。 HiveメタデータはMySQLのようなRDBMSに保存されます。 S3またはHDFSのHiveテーブルデータの場所は、管理対象テーブルと外部テーブルの両方に指定できます。

ハイブは非構造化データを処理できますか?

Hiveを使用した非構造化データの処理
これで、 Hiveを使用して非構造化データを効果的に処理できます。より複雑な処理のニーズについては、代わりにカスタムUDFの作成に戻ることができます。低レベルのMapReduceコードを作成するよりも、高レベルの抽象化を使用することには多くの利点があります。

ハイブの利点は何ですか?

すべてのユーザーが恩恵を受けるのは、スマートホームを作成するためのこのモジュラーアプローチです。Hiveを使用して家を独占的に暖房することも、照明やセンサーなどを制御できるようにすることもできます。これらはすべて、簡単に制御できます。付属のHiveアプリ。

ハイブアーキテクチャとは何ですか?

Hiveのアーキテクチャ
Hiveは、ユーザーとHDFS間の相互作用を作成できるデータウェアハウスインフラストラクチャソフトウェアです。 Hiveは、それぞれのデータベースサーバーを選択して、テーブル、データベース、テーブル内の列、それらのデータ型、およびHDFSマッピングのスキーマまたはメタデータを格納します。

ハイブはMapReduceを使用しますか?

Map Reduceは、HDFSに保存されているデータを処理するために使用されるフレームワークです。ここでは、Javaネイティブ言語を使用してMapReduceプログラムを作成しています。 Hiveはバッチ処理フレームワークです。このコンポーネントは、 Hive Query Language(HQL)と呼ばれる言語を使用してデータを処理します。 Hiveは、JavaでMapReduceプログラムを作成できないようにします。

ハイブインデックスはありますか?

Hiveのインデックス作成機能に制限があります。通常のリレーショナルデータベースの意味ではキーはありません、列にインデックスを作成して一部の操作を高速化できます。テーブルのインデックスデータは別のテーブルに保存されます。

PySparkとは何ですか?

PySparkは、 ApacheSparkをサポートするためにPythonで記述されたPythonAPIです。 Apache Sparkは、ビッグデータ分析を処理できる分散フレームワークです。 Apache SparkはScalaで記述されており、Python、Scala、Java、R、SQL言語と統合できます。

Hiveはどのようにデータを保存しますか?

Hiveは、次の3つの方法でデータを整理します。表:ハイブテーブルはHDFSまたはローカル・ファイル・システムと、これらのテーブルに格納されたデータのメタデータに格納されたデータの論理的な集合です。 HIVEは、メタデータをリレーショナルデータベースに保存します。基本的に、 HIVEには2種類のテーブルがあります。

ハイブとは何ですか?どのように機能しますか?

Apache Hiveは、ハイブSQLのような言語で記述された入力プログラムを1つ以上のJavaマップリデュースジョブに変換することで機能します。次に、クラスター上でジョブを実行して回答を生成します。これはコンパイラと同様に機能します-実行のために高レベルの構造を低レベルの言語に変換します。

Apache Sparkの速度はどれくらいですか?

Apacheのスパークは、より高速なディスク上のHadoopよりもメモリと10倍に高速化100倍までアプリケーションを実行します。

ZooKeeperサーバーとは何ですか?

ZooKeeperはオープンソースのApacheプロジェクトであり、分散システムの大規模なクラスターで構成情報、命名、同期、およびグループサービスを提供するための集中型サービスを提供します。目標は、変更の伝播を改善し、より信頼性の高いものにして、これらのシステムの管理を容易にすることです。