最近では、AI(人工知能)やデータサイエンスを筆頭にビッグデータを扱う機会が増えましたよね。実際に開発の現場でも頻繁にビッグデータを扱うことが増え、ビッグデータ解析サービスで注目を集めているサービスがビッグクエリ(BigQuery)。さまざまな解析技術が登場することはビッグデータを扱う人にとってはとても便利に違いありません。
とはいえ、ビッグクエリを使いたいが使い方を知らない、ビッグクエリ(BigQuery)について聞いたことはあるが詳細はわからない、そもそもビッグクエリ(BigQuery)を良く知らない・・・という人も少なくないでしょう。そこで今回は、ビッグクエリ(BigQuery)について基本的な紹介から使い方の解説までお伝えします。
まずはビッグクエリ(BigQuery)とはどのようなサービスであるのか、その概要について紹介しましょう。
ビッククエリ(BigQuery)とは
ビッグクエリ(BigQuery)とは、Google社のGoogle Cloud Platformが提供しているビッグデータ解析サービスで、Google BigQueryとも呼ばれることがあります。従来の多くのビッグデータ解析サービスと比較して、ビッグクエリ(BigQuery)は大容量のデータを扱うことに長けており、なんとテラバイト(TB)からペタバイト(PB)レベルのデータセットに対して数秒から数十秒程度で抽出や集計が可能とのこと。
ビッグクエリ(BigQuery)は開発者に向けたカンファレンスであるGoogle I/Oにて2012年に公式にリリースされました。Dremelと呼ばれているGoogle社内で使われていたデータ解析サービスがビッグクエリ(BigQuery)のもととなり、それを外部向けに公開した、という歴史があります。
ここまでビッグクエリ(BigQuery)について、基本的な概要を解説しました。次に、ビッグクエリ(BigQuery)で可能となることについて説明します。
ビッククエリ(BigQuery)でできること
ビッグクエリ(BigQuery)の活用可能性は試行錯誤すればさまざまで、多くのことができます。その使い方の中心はデータ分析やデータの蓄積で、多くのデータ解析サービスと同様に使い方を考えることが可能です。
また、ビッグクエリ(BigQuery)は高速で動くので、現在進行形でのデータ分析も活用できます。例えばシステム障害の発生状況や荷物の発送ルートの向上に、ビッグクエリ(BigQuery)による高速なデータ分析は一役買うこと間違いありません。
このようにビッグクエリ(BigQuery)は大量のデータや速度が求められるデータ分析に活用できます。続いて、ビッグクエリがなぜ注目を集め、人気があるのかについて解説します。
ビッククエリ(BigQuery)が人気な理由
記事を読んでいる人のなかには、周囲にビッグクエリ(BigQuery)を使っている、あるいは導入を検討しているところがある人もいるかもしれません。実際ビッグクエリ(BigQuery)は注目を集めており、人気のあるビッグデータ解析サービスです。その理由は、主に大容量のデータセットに対する速さや金額的な敷居の低さ。
ビッグデータを対象としたデータ分析サービスであるビッグクエリ(BigQuery)は、テラバイトからペタバイトレベルのデータセットでも数秒から数十秒程度でクエリ(命令)の要求する処理を終えることが可能です。一般的なデータ分析サービスでも数ギガバイト(GB)のデータセットであれば、分析に耐えうる速度を出せますが、テラバイトを超えてくるとそうはいきません。この大容量のデータセットに対する高速さがビッグクエリ(BigQuery)の強みです。
ビッグクエリ(BigQuery)で多くを占める課金は、データセットに対する1回のクエリの料金ですが、その価格は東京の場合、1テラバイト当たり6ドルとなっています(2020年12月現在)。使用時間当たりによる課金が多くを占めるAzure SQL DWやRedshiftといった競合サービスとは異なり、何回処理を実行したかで決まるため、使用料金がわかりやすく、また導入コストもぐっと抑えることにもつながるでしょう。このような金銭面で敷居が低いこともビッグクエリ(BigQuery)の大きな利点です。
では、実際にビッグクエリ(BigQuery)でビッグデータを分析する方法について解説します。
ビッククエリ(BigQuery)でビッグデータを分析する方法
ビッグクエリ(BigQuery)を用いた分析の手順ですが、Googleアカウントの作成、プロジェクトの作成、データセットの作成、クエリの実行、の4ステップに大きくわかれます。ここでは概要を解説します。
Googleアカウントの作成
Googleのサービスであるから、Googleアカウントの作成は必須です。Googleのありふれた世界であるため、多くの人が持っているかもしれませんが、持っていない、あるいはビッグクエリ(BigQuery)専用に新しいアカウントを作成したい場合は作成しましょう。流れに沿って作成すれば難しいことではないのでご安心を。
プロジェクトの作成
Google Cloud Platform内にプロジェクトを作成することで、データセットやテーブルの作成が可能となります。My Consoleを表示し、Developer Consoleの画面を開き、Hello Worldアプリのデプロイをクリックし、プロジェクト名とプロジェクトIDを作成すれば完成です。
データセットの作成
自前のデータセットを作成する場合、Create new datasetをクリックし、流れに沿って作成すれば大丈夫です。サンプルが事前に用意されているので、それを使う場合はpublicdata.samplesを選択すればOKです。この後、テーブルの作成が待っていますが、Create new tableを選択し、流れに任せれば問題ありません。
クエリの実行
データセットの準備が終わったら、ようやくクエリの実行に移ります。自分が必要としているクエリを流し、実行しましょう。あまり無駄にクエリを流すと過料がかさむのでご注意。
以上がビッグクエリ(BigQuery)の使い方の概要です。この流れに沿えばビッグデータの分析の初歩がつかめます。データセットの作成やクエリの実行を工夫すればさまざまな分析が可能です。
一見万能そうなビッグクエリ(BigQuery)ですが、いくつか注意点もあります。最後に、どのような注意点があるのか紹介しましょう。
ビッククエリ(BigQuery)を使う上での注意点
どのようなサービスでも注意点があるように、ビッグクエリ(BigQuery)を使うにあたっていくつか注意点があります。
ビッグクエリ(BigQuery)は扱うのがそれほど簡単ではなく、熟練した技術者も一部しか存在しません。そのような背景もあってか、ビッグクエリ(BigQuery)に関する情報はそれほど世に出回っているとはいえず、公式ドキュメントさえあまり整っているとは言い難いです。このためビッグクエリ(BigQuery)を使う場合はデータベースを扱うのに長けている人、あるいはそういう人が近くにいる環境にしましょう。
また他のデータ分析サービスにもいえますが、データで何を実現したいか、そのためにはなにを始めたら良いのかわからないとビッグクエリ(BigQuery)は十分な活用ができません。この辺りは経験も必要であり、ビッグクエリ(BigQuery)の扱いに慣れるには時間とコストが必要となります。
さて、今回はビッグクエリ(BigQuery)について基本的な紹介から使い方の解説までお伝えしました。ビッグクエリ(BigQuery)はビッグデータの分析において役に立つサービスで、高速さや廉価が売りとなっており、例えば膨大なユーザーがいて即時性を求められるSNSやソーシャルゲームに使われているのだとか。一方で、注意点も存在します。
- 慣れが必要
- 使い道をはっきりしなければならない
- クエリを実行しすぎるとコストがかかる
使い方の流れは以下の通りです。非常にわかりやすいですよね。
- Googleアカウントの作成
- プロジェクトの作成
- データセットの作成
- クエリの実行
ビッグクエリ(BigQuery)を使うには多少工夫が必要であるため、データベースの熟練者がいるととても有効です。導入の検討を十分にしたうえで、使い方を考えると良いですよね!
【お知らせ】
当メディア(AIZINE)を運営しているAI(人工知能)/DX(デジタルトランスフォーメーション)開発会社お多福ラボでは「福をふりまく」をミッションに、スピード、提案内容、価格、全てにおいて期待を上回り、徹底的な顧客志向で小規模から大規模ソリューションまで幅広く対応しています。
御社の悩みを強みに変える仕組みづくりのお手伝いを致しますので、ぜひご相談ください。