深層学習による物体検出の5手法を解説!活用例や注意点も紹介

深層学習による物体検出の5手法を解説!活用例や注意点も紹介

読み込んだ画像データから特定の物体の「位置」「種類」「個数」などの情報を抽出する物体検出。近年はニューラルネットワークを応用した深層学習による物体検出が活用されており、5つの手法が存在します。

しかしそれぞれの手法の内容を具体的に知っている方は少ないのではないでしょうか。

今回は、深層学習による物体検出の5つの手法を解説していきます。また、活用例や注意点も紹介していますので、ぜひ参考にしてください。

AI導入のノウハウ・活用方法をチェック

深層学習による物体検出とは

物体検出とは、画像や動画から物体を検出する技術です。

人間には見ている画像や動画からそれが何であるかという判断が可能です。それを深層学習を用いて実現する方法が物体検知です。これから例を挙げる様々な手法を用いることで、写ったものの特徴を捉え、識別し、検出することができます。

物体検知なら、画像や動画の中に特定のなにかが検出された時に種類や位置、個数を特定することができます。製造業の外観検査や医療、建設業などで特に活躍する技術です。

身近な例では、スマートフォンのカメラ、自動運転や運転支援システムでの歩行者の検知などに利用されています。

物体検出の5つの手法

深層学習による物体検出には「HOG」「R-CNN」「YOLO」「SSD」「DCN」の5つの手法があります。それぞれの特徴を見ていきましょう。

1.HOG

HOGとは、画像上の物体の向きが変わっても変化しない特徴を認識して、画像上の物体を検出する手法のことです。主に輝度の勾配方向の分布を利用して特徴を捉えています。輝度の変化に左右されないのが大きなメリットです。

しかし画像のサイズを揃えなければならなかったり、正面や横など回転している画像では検出精度が下がったりするデメリットがあります。

2.R-CNN

R-CNNとは、画像内に物体があると推測される領域を提案し、その領域の「特微量」をCNNを複数回利用して抽出し、物体を検出する手法のことです。
「特微量」とは物体を検出するために指定された「手がかりとなる変数」を指します。

検出のためにCNNを何度も利用するため計算コストが非常に高くなり、検出時間やメモリ消費量も大きくなるのがデメリットです。

このデメリットはR-CNNが「Fast R-CNN」や「Faster R-CNN」へと進化するにつれて改善されています。

3.YOLO

YOLOとは、画像を矩形グリッドに区切り、区画ごとにバウンディングボックス(範囲指定のための矩形)を利用して特微量を抽出し、物体を検出する手法です。1区画のグリッドは、必要に応じてさらに細かくなっていきます。

物体の「領域認識」と「クラス判定」を同時に行うため、大幅な処理速度の改善が可能です。
しかし1つのバウンディングボックスに複数の物体があったり、小さい物体だったりする場合は、検出を誤るリスクがあります。

4.SSD

SSDとは、YOLOの欠点改善のためにサイズの違うバウンディングボックスを複数使用した物体検出の手法のことです。

小さな物体でも検出が可能なことや、元が低解像度でも高精度の検出ができることなどがメリットです。しかし矩形のバウンディングボックスからはみ出した物体(異常物体)の検出精度は低いという欠点があります。

5.DCN

DCNとは、バウンディングボックスの形状を変形可能としたことで、矩形に収まらなかった異常物体の検出精度を向上させた手法のことです。

物体検出の手法は、既存の手法の欠点をカバーする形で進化しているのがわかるでしょう。ニューラルネットワークによる深層学習の進歩が、手法の進化を可能にしているといえます。

物体検出の活用例を紹介

ここでは物体検出が活用されている事例を紹介していきます。紹介する事例からもわかるように、深層学習による物体検出のほとんどが日常に密接に結びついたシーンで活用されているのです。

自動運転の実用化

車に設置されたAI機能搭載カメラによって信号や標識、障害物や歩行者などが認識され、適切な自動操作を行うために活用されています。

防犯・監視カメラの解析

AI機能搭載の防犯・監視カメラは、不審者や不審物の検知・追跡を可能にし、犯罪防止に効果を発揮します。

また店舗内においては、顧客の数や行動などをリアルタイムに分析することでマーケティングにも活用されています。駐車場の利用状況も分析できるため、利用者に混雑状況の情報を送るなどのサービスも可能です。

製品検査における品質の向上

製造ラインに深層学習の物体検知技術を活用し、迅速で高精度な「異常検知」と「外観不良検知」を可能にしています。これにより目視検査による品質のバラつきをなくし、製品全体の品質向上に役立っています。

建築物の外観劣化診断の高精度化

AIを搭載した検査機器に大量の画像データを学習させることで、診断結果の精度を高めています。検査員の主観に左右されない診断が可能となり、顧客満足度の向上に貢献します。

医療分野における早期発見

人体内部の検査画像から、微細ながん細胞や腫瘍、出血、炎症などを検出し、早期の治療を可能にしています。またCTやMRIの画像を周囲の画像と結合させることにより、3次元画像として出力することも可能です。

物体検出を行う際の注意点

ここでは物体検出を行う際に注意すべき点を、「検出精度」と「解像度」の観点から見ていきます。

検出精度を向上させる

深層学習による物体検出は、AIが事前に学習した物体の特徴(輪郭、関連する背景など)を利用して行われています。そのため検出精度を上げるには、画像の重なりや対象物の背景に気を配る必要があるのです。

画像上の重なり

画像上に複数の物体が重なっていると、対象物の輪郭の特定が難しくなり誤検知しやすくなります。

例えば、バイクに重なった「猿」の画像が「人」と検知されてしまうことなどがこれにあたります。AIは通常、バイクと人をリンクさせて学習しています。そのためバイクと一緒に写っている猿の輪郭を人として検出してしまうことがあるのです。

背景の統一

AIは対象とする物体と背景も関連させて学習しています。そのため、あまりにも対象物と無関係な背景は、物体誤検知の要因になりかねません。背景は統一されていることが望ましいのです。

例えばジャングルに置かれている自転車のハンドルを考えてみるとわかりやすいでしょう。AIは自転車のハンドルを、翼を広げた鳥と誤検知してしまうことがあるのです。

最適な解像度で検出する

カメラ技術の発達により、画像や映像の解像度は向上する傾向にあります。画像検出は解像度が上がるほど、処理する負荷は高くなり検出に必要な時間が長くなります。そのため、4Kや8Kなどの高解像度画像の物体検出には工夫が必要なのです。

検出時間の差

高解像度の画像を適切な解像度で処理する方法は、「画像のリサイズ」です。4Kや8Kの画像を300〜1200ピクセルにリサイズしてから物体検出を行います。

これにより、検出時間が必要以上には長くなりません。

ただし、そのままでは小さな対象が検出できない可能性があります。その対処法として物体検出に用いるスコアの閾値を0.3くらいまで下げ、検出精度を向上させましょう。こうすることで小さな物体も検出可能になります。

また、高解像度の画像を処理する方法として、「画像を小さく分割」してから検出する方法もあります。しかしこの方法では解像度に変化がないばかりか画像枚数も増えるため、検出時間は非常に長くなるのです。

データ量の差

データ量も、高解像度画像をリサイズする方法を使えば小さく抑えることが可能です。一方、画像を分割する方法によるデータ量は高解像度の場合と変化がなく、手間だけが増えることになりかねません。

しかも画像を分割しているために物体周辺の情報が失われ、誤検知する可能性が高まるというデメリットも発生するので注意が必要です。

AIの深層学習を活用した業務の改善・効率化ならAidiot

aidiotはデータによって社会問題の解決を目指す会社です。深層学習を活用した業務の改善・効率化を始め、AIによる画像解析などデジタルデータの利活用を強力にサポートします。

興味のある方は、ご利用を検討してみてはいかがでしょうか。

https://aidiot.jp/

まとめ

物体検出には5つの手法があり、それぞれに特徴があります。

手法の違いにより、深層学習による物体検出を企業へ導入するコストは大きく違って来るでしょう。目的達成に必要な手法を見極めて、効果的に導入することが必要です。そのためには信頼のおけるサポート会社との協力は非常に効果があります。

また、深層学習による物体検出は、ほとんどが日常に密接に結びついたシーンで活用されていました。近年はアフターコロナによるニューノーマルなど、生活環境は劇的に変化しています。物体検出はそうした変化した環境にも活用範囲を広げていくでしょう。

深層学習による物体検出の正しい知識をもち、有効に活用していけることが、これからのビジネスには必要になるのではないでしょうか。

 

この記事の執筆・監修者
Aidiot編集部
「BtoB領域の脳と心臓になる」をビジョンに、データを活用したアルゴリズムやソフトウェアの提供を行う株式会社アイディオットの編集部。AI・データを扱うエンジニアや日本を代表する大手企業担当者をカウンターパートにするビジネスサイドのスタッフが記事を執筆・監修。近年、活用が進んでいるAIやDX、カーボンニュートラルなどのトピックを分かりやすく解説します。

AI・人工知能カテゴリの最新記事