コンピュータービジョン とは?画像処理の仕組みや開発の進め方を紹介
「コンピュータービジョンとはなにか知りたい」
「コンピュータービジョンのしくみを知りたい」
「コンピュータービジョンでできる事を知りたい」
近年、AIを活用した コンピュータービジョン の開発が世界的に活発化しており、日本でもさまざまな企業が導入を進めています。
今回は、コンピュータービジョン導入を検討中の方に向け、コンピュータービジョンの概要から開発の進め方まで網羅して解説します。
この記事を読めば、コンピュータービジョン導入を一歩先に進めることができます。
経験豊富なコンピュータービジョンエンジニアが多数在籍する、ベトナムのオフショア開発会社カオピーズがお届けします。
目次
- コンピュータービジョンとは?
- コンピュータービジョンでできること?
- 画像内の「顔」を識別
- コンピュータービジョンの活用事例3つ
- 【カオピーズのコンピュータービジョン開発実績】
- コンピュータービジョン開発のすすめ方
- まとめ
1. コンピュータービジョンとは
「 コンピュータービジョン (computer vision)」は「人間の視覚(human vision)」をコンピューターで再現する技術です。
これまで、コンピューターは単純作業や高速処理が得意な反面、画像内に何が映っているかを識別するのは不得意とされてきました。
しかし近年、AIの活用により人間の視覚を超える高い識別精度が実現しています。
はじめに、コンピュータービジョン の概要や歴史について解説します。
1.1 概要
コンピュータービジョンでは、人間の視覚のしくみをアルゴリズムで再現しています。
視覚的に識別するだけではなく、対象物が動いているのかなどの判断もできるようになりました。
これらのベースとなっているのが、人工知能(AI)の「機械学習」「深層学習(ディープラーニング)」と呼ばれるテクノロジーです。
AIに教育用データを与え繰り返し学習をさせることで、AI自らが自動的に識別精度を向上させることが可能になりました。
1.2 歴史
コンピュータービジョン技術の歴史は古く、1960年代から始まります。
当初はコンピューターによる図形の識別が行われ、バーコード読みとりなどが製品化されました。
その後、図形以外のパターンが識別できるようになり、90年代には文字読みとり(OCR)が広まりました。
2000年代に入るとAIが導入され、顔認識や自動運転分野で高度なコンピュータービジョンシステムが開発されました。
現在はあらゆる分野で導入が進み、ビジネスのDX化が加速しています。
1.3 目的と重要性
コンピュータービジョンの大きな目的は、「ヒューマンエラーの減少」「作業時間の短縮」の2つです。
人間の視覚は大変優れていますが、慣れや心身の不調などによるミスは避けられず、ときに企業に重大な損害を与えます。
コンピュータービジョンではこのようなエラーを回避し、定型作業を自動化することにより、作業時間を大きく短縮することができます。
身分証の確認から航空分野での異常検知まで、幅広い分野で必要不可欠な技術となっています。
2. コンピュータービジョン でできること
コンピュータービジョンでできることを把握しておけば、目的にあった適切な活用法がみつかります。
ここでは、コンピュータービジョンの代表的な機能を4つご紹介します。
2.1 画像内の「文字」を読みとる
文字を読みとる技術は、「OCR:光学式文字認識」と呼ばれています。
従来のOCRは特定フォントしか読みとれませんでしたが、現在ではAI-OCRにより、手書き文字も読みとれるようになりました。
漢字・ひらがな・英数字などあらゆる文字の読みとりができ、アンケートなどの大量データも短時間で処理できます。
※ 関連記事:AI画像認識 AI-OCRを解説 | 手書きも認識!OCRとの違いも
2.2 画像内の「モノの個数」を数える
物体の個数を数える技術は、「個数カウント」と呼ばれています。
これまでは決められた条件下でのカウントしかできませんでしたが、ディープラーニングの活用で、あらゆる特徴のものが識別可能になりました。
動いているものもカウントでき、車の交通量調査・微生物のカウントなどさまざまな分野での応用が進んでいます。
※関連記事:【カオピーズの独自技術】 AI画像認識・画像処理による個数カウントソリューション
2.3 画像内の「モノの種類」を識別
物体の種類を識別する技術には「オブジェクトディテクション」「インスタンスセグメンテーション」などがあります。
オブジェクトディテクションでは、背景をとり除き人やモノなど必要な物体を切り出すことができます。
インスタンスセグメンテーションを活用すると、人ごみなど大勢の人が重なり合う状況でも、正確に検出し識別されます。
2.4 画像内の「顔」を識別
人間の顔を識別する技術は、「顔認証システム」として広く普及しています。
顔の向き・髪型が変化しても高い精度で認証でき、なりすましはほぼ不可能になっています。
また、近年ではスマホで撮った画像をオンラインで認識するeKYC(Electronic Know Your Customer)による本人確認が積極的に導入されており、スピーディーな認証が実現しています。
※関連記事:画像認識でできること~AI画像認識の導入方法~【2023年最新】
3. コンピュータービジョン のしくみ
コンピュータービジョンの処理は、「画像取得」「画像処理」「画像認識」の3ステップで実行されます。
3.1 ステップ1:画像取得
はじめに、カメラで撮影した動画から画像を抽出します。
カメラは市販のもの、スマホ搭載カメラ、医療機器などさまざまなデバイスが使用できます。
ただし、動画の中から静止画を抽出する場合、一般的な画面キャプチャでは画質が荒くなります。
そのため、コンピュータービジョン用に最適化された抽出技術を使用します。
3.2 ステップ2:画像処理
コンピュータービジョン技術を使用して、画像の分析を行います。
分析には、何千枚もの画像によりトレーニングされたAIモデルが使用されます。
AIモデルにより、画像内の特徴を学習済みのデータと比較し、物体の種類・形・色・大きさなどについて分析が行われます。
3.3 ステップ3:画像認識
分析結果にもとづき、物体の識別を確定します。
識別結果は、アプリケーションで画面表示したり、入力フォームに自動的に反映させたりすることができます。
コンピュータービジョンでは、学習を繰り返すことにより精度が向上するため、使用すればするほど、正確な結果が期待できます。
4. コンピュータービジョン の活用事例3つ
コンピュータービジョンは、あらゆる分野でビジネスのDX化を加速できる可能性を秘めています。
そして、大手だけなくスタートアップ・ベンチャー・中小企業も参入できる点が大きな魅力です。
ここでは、コンピュータービジョンの活用事例を3つご紹介します。
4.1 農業
農業ではすでにコンピュータービジョンの導入が進んでいます。
これまで人間が行っていた識別作業をAIで自動化し、「秀」「優」「良」などのランクにスピーディーに振りわけるなどの事例があります。
このほかにも、ドローンの撮影画像を解析し害虫被害を検出するなど、さまざまな用途で活用が進んできます。
4.2 医療
医療用画像を解析することにより、正確な診断や患部の特定が行われています。
MRI・CTTスキャン・レントゲン画像をコンピュータービジョンで解析し、医師の目視確認に匹敵する正確性で異常を検出します。
また手術現場では、医療器具が患者の体内に残されてしまう事故を防ぐ目的で、コンピュータービジョンによる医療器具のカウントが行われています。
4.3 セキュリティ
監視カメラにより不審者の侵入を検知したり、録画映像から人が映っているシーンだけを検出したりする管理システムが導入されています。
そのほかにも、空港でのブラックリスト入り人物の特定、銀行などでの厳格な本人確認にコンピュータービジョン技術が活用されています。
5.【カオピーズのコンピュータービジョン開発実績】
弊社カオピーズでは、AIを活用したコンピュータービジョンモデルの研究開発を行っています。
コンピュータービジョンに精通したエンジニアが多数在籍しており、数多くの企業様のサポートをさせていただいています。
ここでは、弊社の開発実績を3つご紹介します。
5.1 名刺読取
「名刺読取OCR」では、名刺の情報を正確に抽出しテキストとして出力することができます。
読みとり精度は93%で、1枚あたり平均10秒で読みとることができます。
どのようなデザインの名刺にも対応しており、さまざまなフォントも正確に読みとります。
5.2 運転免許情報読取
「運転免許証読取 OCR」では、運転免許証の情報を正確にテキストとして出力します。
免許証の傾きや背景の映り込みなどにも対応しており、95%と高い読みとり精度を実現しています。
漢字・ひらがな・カタカナなど3600文字の識別を1枚あたり1.8秒で完了します。
5.3 手書き読取
「手書きOCRエンジン」では、91%の精度で手書き文字を正確にテキストとして出力します。
文字のかすれやはみ出し、書類のズレにも対応できあらゆる文書からの読みとりが行えます。
また、高速な処理で業務の効率化を実現します。
6. コンピュータービジョン開発のすすめ方
社内でコンピュータービジョンエンジニアが不足している場合、実績のある開発会社への相談がおすすめです。
ここでは、弊社カオピーズでの開発のすすめ方をご紹介します。
6.1 ヒアリング(1週間~)
お客様の課題にコンピュータービジョンがマッチするか、ヒアリングさせていただきます。
お客様が実現させたいことをおうかがいし、コンピュータービジョンで実現できることをご提案します。
実現できそうであれば、大まかなご予算・スケジュールなどご要望全般についてもヒアリングをさせていただきます。
6.2 PoC実証実験(2週間~)
ヒアリングの内容にもとづき、お客様から画像データを提供していただきます。
ご提供いただいた画像を使用し、コンピュータービジョンモデルの学習と検証を行います。
この作業はPoC(Proof of Concept:概念実証)と呼ばれており、お客様と弊社双方で実現性を見極めます。
6.3 開発作業(2ヵ月~)
PoCにより実現性が確認できれば、開発作業に入ります。
弊社ではお客様とのやりとりは日本法人エンジニア、開発作業はベトナム法人エンジニアが担当させていただきます。
開発後の保守運用も対応しており、コンピュータービジョンに関するワンストップサービスをご提供しています。
7. まとめ
今回は、コンピュータービジョンについて解説しました。
- コンピュータービジョンは人間の視覚を再現する技術
- ヒューマンエラーの減少・業務効率化が実現できる
- スタートアップ企業にも参入のチャンスがある
カオピーズでは、コンピュータービジョンに関する技術提案からシステム化まで、一貫したサービスを行っています。
「こんなことを実現したい」など、アイディア段階のご相談も受け付けておりますので、お気軽にお問い合わせください 。