Apache Hiveを使用しているのは誰ですか?
質問者:Bouabid Wimberger |最終更新日:2020年3月3日
カテゴリ:趣味と興味の養蜂
現在ApacheHiveを使用している企業
会社名 | Webサイト | 収益(USD) |
---|---|---|
ウェルズ・ファーゴ | wellsfargo.com | $ 1,000,000,000以上 |
アップル | apple.com | $ 1,000,000,000以上 |
シティ | citi.com | $ 1,000,000,000以上 |
ウォルマート | walmart.com | $ 1,000,000,000以上 |
Apache Hiveは、通常データアナリストによってデプロイされるHadoopコンポーネントです。 Apache Pigも同じ目的でデプロイできますが、 Hiveは研究者やプログラマーによってより多く使用されています。これはオープンソースのデータウェアハウジングシステムであり、Hadoopに保存されている巨大なデータセットのクエリと分析にのみ使用されます。
さらに、ハイブはまだ使用されていますか? Hiveは2008年8月にオープンソース化され、それ以来、データ処理のニーズのために多くのHadoopユーザーによって使用および調査されてきました。
このようにして、Apache Hiveを作成したのは誰ですか?
Apache Hiveは、最初はFacebookによって開発されましたが、NetflixやFinancial Industry Regulatory Authority(FINRA)などの他の企業によって使用および開発されています。
なぜハイブが必要なのですか?
Apache Hiveを使用すると、開発者はアドホック要件のために複雑なHadoopMapReduceジョブを作成する必要がなくなります。したがって、ハイブはデータの要約、分析、およびクエリを提供します。 Hiveは非常に高速でスケーラブルです。 Hiveは、ユーザーがSQLクエリを送信できるインターフェイスを提供することにより、MapReduceの複雑さを軽減します。
39関連する質問の回答が見つかりました
Hadoopなしでハイブを実行できますか?
Hadoopはコアのようなものであり、 Hiveにはそこからいくつかのライブラリが必要です。この答えを更新古くありません:ハイブとスパークにはHDFSのサポートを持っていることはもはや必要です。 Hiveにはhdfsとmap / reduceが必要なので、それらが必要になります。しかし、その要点は次のとおりです。ハイブにはHadoopとm / rが必要なので、ある程度対処する必要があります。
ハイブはデータベースですか?
Hiveは、Hadoopエコシステム上にあるETLおよびデータウェアハウスツールであり、構造化および半構造化データの処理に使用されます。 Hiveは、Hadoopエコシステムに存在するデータベースであり、DDLおよびDML操作を実行し、データのクエリと処理を改善するためのHQLなどの柔軟なクエリ言語を提供します。
ハイブは思い出ですか?
Hiveはユーザー、グループ、およびロールにアクセス権を提供しますが、Sparkはまだそのようなサポートを提供していません。 Sparkのインメモリ処理はほぼリアルタイムの分析を提供しますが、 Hiveは主にETL、バッチジョブに使用されます。
なぜハイブはデータウェアハウスなのですか?
Hiveは、Hadoopで構造化データを処理するためのデータウェアハウスインフラストラクチャツールです。ビッグデータを要約するためにHadoopの上にあり、クエリと分析を簡単にします。スキーマをデータベースに格納し、データをHDFSに処理するため、データウェアハウスツールと呼ばれています。 OLAP用に設計されています。
ハイブはSQLですか、それともNoSQLですか?
HiveはNoSQLデータベースですか? Apache Hiveは読み取り専用のSQLダイアレクトを提供するため、その意味で、リレーショナルデータベースの非標準のSQL風のインターフェイスを公開しますが、OLAPタイプはOLTPタイプではありません。複数のデータソース、通常はビッグデータスペースの分散システムをサポートします。
Hiveデータはどこに保存されますか?
2つの答え。 Hiveデータは、Hadoop互換ファイルシステム(S3、HDFS、またはその他の互換性のあるファイルシステム)のいずれかに保存されます。 HiveメタデータはMySQLのようなRDBMSに保存されます。 S3またはHDFSのHiveテーブルデータの場所は、管理対象テーブルと外部テーブルの両方に指定できます。
ハイブは非構造化データを処理できますか?
Hiveを使用した非構造化データの処理
これで、 Hiveを使用して非構造化データを効果的に処理できます。より複雑な処理のニーズについては、代わりにカスタムUDFの作成に戻ることができます。低レベルのMapReduceコードを作成するよりも、高レベルの抽象化を使用することには多くの利点があります。 ハイブの利点は何ですか?
すべてのユーザーが恩恵を受けるのは、スマートホームを作成するためのこのモジュラーアプローチです。Hiveを使用して家を独占的に暖房することも、照明やセンサーなどを制御できるようにすることもできます。これらはすべて、簡単に制御できます。付属のHiveアプリ。
ハイブはどの言語で書かれていますか?
Java
ハイブアーキテクチャとは何ですか?
Hiveのアーキテクチャ
Hiveは、ユーザーとHDFS間の相互作用を作成できるデータウェアハウスインフラストラクチャソフトウェアです。 Hiveは、それぞれのデータベースサーバーを選択して、テーブル、データベース、テーブル内の列、それらのデータ型、およびHDFSマッピングのスキーマまたはメタデータを格納します。 ハイブはMapReduceを使用しますか?
Map Reduceは、HDFSに保存されているデータを処理するために使用されるフレームワークです。ここでは、Javaネイティブ言語を使用してMapReduceプログラムを作成しています。 Hiveはバッチ処理フレームワークです。このコンポーネントは、 Hive Query Language(HQL)と呼ばれる言語を使用してデータを処理します。 Hiveは、JavaでMapReduceプログラムを作成できないようにします。
ハイブインデックスはありますか?
Hiveのインデックス作成機能には制限があります。通常のリレーショナルデータベースの意味ではキーはありませんが、列にインデックスを作成して一部の操作を高速化できます。テーブルのインデックスデータは別のテーブルに保存されます。
PySparkとは何ですか?
PySparkは、 ApacheSparkをサポートするためにPythonで記述されたPythonAPIです。 Apache Sparkは、ビッグデータ分析を処理できる分散フレームワークです。 Apache SparkはScalaで記述されており、Python、Scala、Java、R、SQL言語と統合できます。
Hiveはどのようにデータを保存しますか?
Hiveは、次の3つの方法でデータを整理します。表:ハイブテーブルはHDFSまたはローカル・ファイル・システムと、これらのテーブルに格納されたデータのメタデータに格納されたデータの論理的な集合です。 HIVEは、メタデータをリレーショナルデータベースに保存します。基本的に、 HIVEには2種類のテーブルがあります。
ハイブとは何ですか?どのように機能しますか?
Apache Hiveは、ハイブSQLのような言語で記述された入力プログラムを1つ以上のJavaマップリデュースジョブに変換することで機能します。次に、クラスター上でジョブを実行して回答を生成します。これはコンパイラと同様に機能します-実行のために高レベルの構造を低レベルの言語に変換します。
Apache Sparkの速度はどれくらいですか?
Apacheのスパークは、より高速なディスク上のHadoopよりもメモリと10倍に高速化100倍までアプリケーションを実行します。
ZooKeeperサーバーとは何ですか?
ZooKeeperはオープンソースのApacheプロジェクトであり、分散システムの大規模なクラスターで構成情報、命名、同期、およびグループサービスを提供するための集中型サービスを提供します。目標は、変更の伝播を改善し、より信頼性の高いものにして、これらのシステムの管理を容易にすることです。