テクノロジー

ビッグデータを解析するビッグクエリとは?基本から使い方まで徹底解説

ビッグデータを解析するビッグクエリとは?基本から使い方まで徹底解説

最近では、AI(人工知能)やデータサイエンスを筆頭にビッグデータを扱う機会が増えましたよね。実際に開発の現場でも頻繁にビッグデータを扱うことが増え、ビッグデータ解析サービスで注目を集めているサービスがビッグクエリ(BigQuery)。さまざまな解析技術が登場することはビッグデータを扱う人にとってはとても便利に違いありません。

とはいえ、ビッグクエリを使いたいが使い方を知らない、ビッグクエリ(BigQuery)について聞いたことはあるが詳細はわからない、そもそもビッグクエリ(BigQuery)を良く知らない・・・という人も少なくないでしょう。そこで今回は、ビッグクエリ(BigQuery)について基本的な紹介から使い方の解説までお伝えします。

まずはビッグクエリ(BigQuery)とはどのようなサービスであるのか、その概要について紹介しましょう。

ビッククエリ(BigQuery)とは

ビッグデータのイメージ
ビッグクエリ(BigQuery)とは、Google社のGoogle Cloud Platformが提供しているビッグデータ解析サービスで、Google BigQueryとも呼ばれることがあります。従来の多くのビッグデータ解析サービスと比較して、ビッグクエリ(BigQuery)は大容量のデータを扱うことに長けており、なんとテラバイト(TB)からペタバイト(PB)レベルのデータセットに対して数秒から数十秒程度で抽出や集計が可能とのこと。

ビッグクエリ(BigQuery)は開発者に向けたカンファレンスであるGoogle I/Oにて2012年に公式にリリースされました。Dremelと呼ばれているGoogle社内で使われていたデータ解析サービスがビッグクエリ(BigQuery)のもととなり、それを外部向けに公開した、という歴史があります。

またビッグクエリ(BigQuery)では2016年頃から標準SQLのサポートを開始しました。SQLとはStructured Query Languageの略で、データベースを扱うのに使われてきた代表的な言語のひとつです。このSQLの知識をもとに動かせるビッグデータ解析サービスであることもビッグクエリ(BigQuery)の特徴のひとつでしょう。

ここまでビッグクエリ(BigQuery)について、基本的な概要を解説しました。次に、ビッグクエリ(BigQuery)で可能となることについて説明します。

ビッククエリ(BigQuery)でできること

ゲームのイメージ
ビッグクエリ(BigQuery)の活用可能性は試行錯誤すればさまざまで、多くのことができます。その使い方の中心はデータ分析やデータの蓄積で、多くのデータ解析サービスと同様に使い方を考えることが可能です。

例えば、SNSやソーシャルゲームを筆頭としたたくさんのユーザーを抱えているシステムやサービスにおいて、膨大に蓄積されたユーザーの行動やアクセスを分析したい、という場面はありますよね。このときにビッグクエリ(BigQuery)は力を発揮し、さまざまな分析ができます。得られた分析結果は、サービスの改善や新機能の追加の検討など、いかにより良く快適にユーザーがシステムやサービスを利用できるか、新規ユーザーを獲得できるか、利益を上げることができるか、といったことの検討材料になるでしょう。

また、ビッグクエリ(BigQuery)は高速で動くので、現在進行形でのデータ分析も活用できます。例えばシステム障害の発生状況や荷物の発送ルートの向上に、ビッグクエリ(BigQuery)による高速なデータ分析は一役買うこと間違いありません。

このようにビッグクエリ(BigQuery)は大量のデータや速度が求められるデータ分析に活用できます。続いて、ビッグクエリがなぜ注目を集め、人気があるのかについて解説します。

ビッククエリ(BigQuery)が人気な理由

コストのイメージ
記事を読んでいる人のなかには、周囲にビッグクエリ(BigQuery)を使っている、あるいは導入を検討しているところがある人もいるかもしれません。実際ビッグクエリ(BigQuery)は注目を集めており、人気のあるビッグデータ解析サービスです。その理由は、主に大容量のデータセットに対する速さや金額的な敷居の低さ。

ビッグデータを対象としたデータ分析サービスであるビッグクエリ(BigQuery)は、テラバイトからペタバイトレベルのデータセットでも数秒から数十秒程度でクエリ(命令)の要求する処理を終えることが可能です。一般的なデータ分析サービスでも数ギガバイト(GB)のデータセットであれば、分析に耐えうる速度を出せますが、テラバイトを超えてくるとそうはいきません。この大容量のデータセットに対する高速さがビッグクエリ(BigQuery)の強みです。

ビッグクエリ(BigQuery)で多くを占める課金は、データセットに対する1回のクエリの料金ですが、その価格は東京の場合、1テラバイト当たり6ドルとなっています(2020年12月現在)。使用時間当たりによる課金が多くを占めるAzure SQL DWやRedshiftといった競合サービスとは異なり、何回処理を実行したかで決まるため、使用料金がわかりやすく、また導入コストもぐっと抑えることにもつながるでしょう。このような金銭面で敷居が低いこともビッグクエリ(BigQuery)の大きな利点です。

では、実際にビッグクエリ(BigQuery)でビッグデータを分析する方法について解説します。

ビッククエリ(BigQuery)でビッグデータを分析する方法

分析のイメージ
ビッグクエリ(BigQuery)を用いた分析の手順ですが、Googleアカウントの作成、プロジェクトの作成、データセットの作成、クエリの実行、の4ステップに大きくわかれます。ここでは概要を解説します。

Googleアカウントの作成

Googleのサービスであるから、Googleアカウントの作成は必須です。Googleのありふれた世界であるため、多くの人が持っているかもしれませんが、持っていない、あるいはビッグクエリ(BigQuery)専用に新しいアカウントを作成したい場合は作成しましょう。流れに沿って作成すれば難しいことではないのでご安心を。

プロジェクトの作成

Google Cloud Platform内にプロジェクトを作成することで、データセットやテーブルの作成が可能となります。My Consoleを表示し、Developer Consoleの画面を開き、Hello Worldアプリのデプロイをクリックし、プロジェクト名とプロジェクトIDを作成すれば完成です。

データセットの作成

自前のデータセットを作成する場合、Create new datasetをクリックし、流れに沿って作成すれば大丈夫です。サンプルが事前に用意されているので、それを使う場合はpublicdata.samplesを選択すればOKです。この後、テーブルの作成が待っていますが、Create new tableを選択し、流れに任せれば問題ありません。

クエリの実行

データセットの準備が終わったら、ようやくクエリの実行に移ります。自分が必要としているクエリを流し、実行しましょう。あまり無駄にクエリを流すと過料がかさむのでご注意。

以上がビッグクエリ(BigQuery)の使い方の概要です。この流れに沿えばビッグデータの分析の初歩がつかめます。データセットの作成やクエリの実行を工夫すればさまざまな分析が可能です。

一見万能そうなビッグクエリ(BigQuery)ですが、いくつか注意点もあります。最後に、どのような注意点があるのか紹介しましょう。

ビッククエリ(BigQuery)を使う上での注意点

疑問のイメージ
どのようなサービスでも注意点があるように、ビッグクエリ(BigQuery)を使うにあたっていくつか注意点があります。

ビッグクエリ(BigQuery)は扱うのがそれほど簡単ではなく、熟練した技術者も一部しか存在しません。そのような背景もあってか、ビッグクエリ(BigQuery)に関する情報はそれほど世に出回っているとはいえず、公式ドキュメントさえあまり整っているとは言い難いです。このためビッグクエリ(BigQuery)を使う場合はデータベースを扱うのに長けている人、あるいはそういう人が近くにいる環境にしましょう。

また他のデータ分析サービスにもいえますが、データで何を実現したいか、そのためにはなにを始めたら良いのかわからないとビッグクエリ(BigQuery)は十分な活用ができません。この辺りは経験も必要であり、ビッグクエリ(BigQuery)の扱いに慣れるには時間とコストが必要となります。

ビッグクエリ(BigQuery)の特徴であるクエリごとに料金が発生するという料金体系にも注意が必要です。コストを最小限に抑えるには最小限のクエリを実行することが求められ、入念にクエリを決めなければなりません。例えば、データの探索のために“SELECT *”を実行すると全データを照会することになるのでコストがかかることから、データの探索にはデータプレビューオプションを使う、といった工夫が必要です。

まとめ
さて、今回はビッグクエリ(BigQuery)について基本的な紹介から使い方の解説までお伝えしました。ビッグクエリ(BigQuery)はビッグデータの分析において役に立つサービスで、高速さや廉価が売りとなっており、例えば膨大なユーザーがいて即時性を求められるSNSやソーシャルゲームに使われているのだとか。一方で、注意点も存在します。

  • 慣れが必要
  • 使い道をはっきりしなければならない
  • クエリを実行しすぎるとコストがかかる

使い方の流れは以下の通りです。非常にわかりやすいですよね。

  1. Googleアカウントの作成
  2. プロジェクトの作成
  3. データセットの作成
  4. クエリの実行

ビッグクエリ(BigQuery)を使うには多少工夫が必要であるため、データベースの熟練者がいるととても有効です。導入の検討を十分にしたうえで、使い方を考えると良いですよね!

【お知らせ】

当メディア(AIZINE)を運営しているAI(人工知能)/DX(デジタルトランスフォーメーション)開発会社お多福ラボでは「福をふりまく」をミッションに、スピード、提案内容、価格、全てにおいて期待を上回り、徹底的な顧客志向で小規模から大規模ソリューションまで幅広く対応しています。

御社の悩みを強みに変える仕組みづくりのお手伝いを致しますので、ぜひご相談ください。

お多福ラボコーポレートサイトへのバナー

トップへ戻る
タイトルとURLをコピーしました