ビッグデータって何?【簡単に】身近な活用例を用いて、ご説明します。

1、はじめに

こんにちは、私は最近IT業界に就職したパエリアといいます。ところで、皆さんは「ビッグデータ」をご存じですか?「ビッグデータ」をはじめて聞いた方、
また「ビッグデータ」を聞いたことがある方は、誰かにどういう意味なのか聞かれたら説明することができますか?ここでは、「ビッグデータ」について簡単にご説明し、世の中にどう役立っているのかいくつか活用例を出しながらご紹介していきます。

2、ビッグデータとは?

2-1  簡単に説明すると

まず、ビッグデータとは何だろう?という方にざっくりとした言葉で表すと

「従来のデータ管理技術では扱うのが困難なほど、
巨大で多種多様なデータ(文字、音声、動画など)


ビッグデータは「ビッグ」と付くだけあって膨大な量と様々な種類のデータを持ち合わせます。

このビッグデータを活用できれば、社会問題を解決できたり、ビジネス面においては競争優位性を得ることができ、皆さんの身近なところで役立っています。

 2-2  定義と4Vについて

もっと具体的にご説明するとビッグデータの定義は、総務省により以下のように記されています。

『ビッグデータの特徴としては、データの利用者やそれを支援する者それぞれにおける観点から異なっているが、共通する特徴としては、多量性、多種性、リアルタイム性等が挙げられる。ICTの進展により、このような特徴を伴った形でデータが生成・収集・蓄積等されることが可能・容易になってきており、異変の察知や近未来の予測等を通じ、利用者個々のニーズに即したサービスの提供、業務運営の効率化や新産業の創出等が可能となる点に、ビッグデータの活用の意義があるものと考えられる。』

総務省 ビッグデータとは何かより引用

またビッグデータは4V(様々な形をした、様々な性格を持った、様々な種類のデータ、リアルタイム性)と表される重要な4つの要素から構成されます。

そこで、ビッグデータについて調べたことがある方は4Vって何?と疑問を持ったことがあるのではないでしようか。それではご紹介します。

ビッグデータを中心に、Volume,Velocity,Variety.Veracityが周りに付属している。

1.Volume (容量)

単純にデータの量を意味します。
例えば大勢のネットショッピング履歴を保管し分析することでどの商品が人気なのか把握することができます。 

2.Velocity(頻度、スピード)

多量のデータを収集し分析するスピードを意味します。
身近な例では、新型コロナウイルスの感染者数を推計する際により最新のデータを瞬時に分析し精度を上げています。

3. Variety(種類)

データの種類を意味します。
データには画像、音声、位置情報、etc… 様々なデータがあります。

 4. Veracity(正確性)  

データの正確性を意味します。
多量のデータのなかには間違った情報や不正確な情報が紛れています。これらのデータに気をつけて正確なデータを抽出することによってデータの精度が上がります。

これら4Vによってビッグデータは構成されています。

いかがですか?なんとなく理解できた方もいらっしゃいますか?

まだまだ定義とか4Vとかなんだか難しい!という方、安心してください。
次は、わかりやすく身近な活用例を用いてご説明していきます。

3、身近な活用例

3-1  防犯カメラ

従来、スーパーなどのお店の防犯カメラは万引きの発見と防止を目的とした映像を記録することが本来の活用方法でした。しかしビッグデータの活用により
最新の防犯カメラは、映像を記録するだけでなく怪しいお客さんの容姿を記憶し、容姿認証を用いてカメラに写ったとき店員さんに注意を促すことができます。

3-2 新型コロナウイルスの感染予測

感染者がいつ、どこで発生したのか何万人にも及ぶデータを収集することで、
感染の広がり傾向を把握することができ、約1カ月先の感染者数の推移を
予測することができます。この増加傾向を予測し、感染拡大の抑制に役立っています。

参考元 ・ビッグデータで読み解く 新型コロナの“今後”

これらの例の他にも様々な分野でビッグデータは活用されており、社会の役に立っています。ここまでくると、段々とあのサービスもビッグデータが活用されているのかな?と想像できそうじゃないですか。

4、問題点

しかしながら、ビッグデータには良い点ばかりではなく、問題点もあります。
最近では、個人情報や企業などの社内データの流出に関する問題がよくニュースになっています。

より多くの情報を集められれば、競争優位性を得ることが
できるので、セキュリティを強化しないとデータを狙って不正アクセスされる可能性があります。

もし情報が流出すると個人情報であれば、個人が特定され
プライバシーの侵害につながったり、社内データが流出すると企業の社会的信用をなくす恐れもあります。なので情報の取り扱いには注意を払わなければなりません。

5、 保存先

ところで、話は打って変わり、ここまでビッグデータの活用例や問題点をご紹介してきて、ビッグデータは従来のデータベースでは管理しきれないほどデータが膨大であると理解していただけたかと思います。

そこで、従来の方法では管理できないならじゃあ一体どこで管理できるんだ?と思いませんか。

人が疑問に感じている。

実際に、この疑問はビッグデータを活用する企業等で課題になっています。
企業が自社のデータサーバーでビッグデータを一元管理するのはコスト的にも
サーバーの容量的な負担を考えても困難です。

そこで、ビッグデータの管理はクラウドでのデータ保存が便利です。
クラウドからビッグデータを扱えば、端末や場所に縛られずどこからでもデータを抽出することができます。

またサーバーの運用負担も減らすことができるので、これまで運用してきた
エンジニアさんの作業負担を軽減することができ、人件費の削減にもなります。(但し、クラウド利用にもデータが増えればコストがかかるので減益にならないように折り合いが必要)。

なので、企業によるビッグデータ管理はクラウドが推奨されています。

※ クラウド:インターネット上の仮想スペースにデータを保存したりバックアップができ、また利用したいときに利用したい分だけデータのやり取りができるサービスのこと。

参考元 ・クラウドとは?意味・定義|ITトレンド用語|NTTコミュニケーションズ
    ・AOSデータバックアップ ビッグデータの保存先はどこ?

6、まとめ

いかがでしたでしょうか?ビッグデータについて定義から身近な活用例まで、
できるだけ理解していただけるように簡単にご説明してみました。

ビッグデータによって便利な社会になったのは事実ですが、その取扱いには
まだまだ課題がたくさんあります。ビッグデータは企業にかかわらず、
皆さんにとっても大事な情報資源で蓄積すればするほど価値は高まります。

なので上手にビッグデータを活用して、これからもっと社会が便利になることを
私は期待します。

作者情報

海外旅行とサッカーが大好き、世界を旅するIT業界初心者、パエリアです。
一番好きな国はスペインです。パエリアは元々フライパンという意味でしたが、いつの間にか料理の名前になりました。