マルチクラウド 担当者コラム
マルチクラウド・Azure
Azure 第28回『多彩なAzureのAIサービスをご紹介』
AOAI だけじゃない - Azure の AI サービス
Azure の AI サービスでは、昨年公開された Azure Open AI Services(AOAI)が注目を集めていますが、Azure で提供されている AI サービスは AOAI だけではありません。AOAIが公開される以前から Azure ではさまざまな AI のサービスが提供されており、幅広い分野で活用されています。
Azure での AI のサービスは大きく分けて2つあります。1つは Microsoft が事前に構築した AI モデルをサービスとして利用できる Azure AI サービス、もう1つは Microsoft が提供する機械学習システムを使って利用者がモデルを構築して利用する Azure Machine Learning です。また Azure AI サービスでは構築済みモデルをそのまま利用するサービスと、利用者がある程度カスタマイズして利用できるサービスがあります。
今回はこの内の Azure AI サービスについて紹介します。
Azure AI サービスは以前「Azure Cognitive サービス」と呼ばれていました。
Azure Machine Learning は AI や機械学習についての専門的なエンジニアが独自の AI モデルを構築して利用できるサービスとして提供されています。Azure Machine Learning について詳しくは、以下を参照してください。
Azure AI サービスの種類
Azure では以下のような種類の AI サービスが提供されています。
サービス | 説明 |
---|---|
Azure AI Search |
AI を利用したクラウド検索 |
Azure OpenAI |
さまざまな自然言語タスクの実行 |
Bot Service |
ボットの作成・複数のチャネルにわたる接続 |
Content Safety |
望ましくないコンテンツの検出 |
Custom Vision |
ビジネスに合わせた画像認識のカスタマイズ |
Document Intelligence |
ドキュメントの使用可能なデータへの変換 |
Face |
画像内の人や感情の検出および識別 |
Immersive Reader |
ユーザーのテキストを読解・理解の支援 |
Language |
自然言語理解機能を備えたアプリの構築 |
Speech |
音声テキスト変換、テキスト読み上げ、翻訳、話者認識 |
Translator |
100 以上の言語・方言の翻訳 |
Video Indexer |
ビデオからアクションにつながる分析情報を抽出 |
Vision |
画像と動画のコンテンツの分析 |
Azure Open AI、Content Safety、Speech、Vision などの Azure AI サービスを利用するための統合開発環境として Azure AI Studio が提供されています(現在プレビュー中)。
Azure Open AI(AOAI)は大規模言語モデル(LLM)を利用し、プロンプト(指示)を通じて対話的にコンテンツの作成・コンテンツへの操作を行うアプリケーション(ボット)を作成できるサービスですが、それ以外にも AI で実現できるタスクは多数あります。
AOAI については以前の記事で紹介しています。
AOAI を活用する上では、それ以外のさまざまな種類の AI を組み合わせて利用することで、より幅広い分野での応用や精度の高い生成が行えます。
例えば Custom Vision や Face で画像を認識した結果を AOAI に与える、Document Intelligence で手書きや印刷された文書を読み取って AOAI で利用する、Translator や Speech を利用して音声で対話できる AOAI のボットを作成するなど、AOAI 単独では行えないさまざまな作業を他の AI サービスで実現できます。
これらのサービスはいずれも事前構築済みやカスタマイズ可能な AI モデルと API として提供されており、AI や機械学習についての専門的な知識が無くても利用可能です。そのため大規模な事前準備無しで AI を活用したアプリやボットの開発が行えます。
またこれまでに開発した既存のアプリケーションのコードに AI を利用した機能が簡単に追加できるので、アプリケーションの DX 化・モダナイゼーションを進めることが可能です。
以下では、これらの AI サービスの中からいくつかのサービスについて、その概要やユースケースを紹介します。
Azure AI Custom Vision
Custom Vision では、一定数の画像とその分類ラベル(グループ)を学習させることで、与えられた画像がどのグループに属しているかを判定させることができます。例えば、花の写真を学習させることで、花の種類や色、形などを識別することができます。
以下の例では麺類の写真とラベル(「そば」と「うどん」)を学習させることで、AI に写真を与えるとそれが「そば」なのか「うどん」なのか判別できるシステムを構築できます。
Custom Vision の具体的なユースケースとしては、以下のようなものが挙げられます。
-
小売業での在庫管理や商品レコメンデーション。画像から商品の種類や属性を判定し、在庫の確認や顧客の好みに合わせた提案を行うことができます。
-
医療分野での診断支援。画像から病気の兆候や症状を検出し、医師の判断を補助することができます。
-
農業分野での作物管理や病害防除。画像から作物の成長状況や病害の有無を判断し、最適な栽培方法や対策を決めることができます。
学習なしで Microsoft が構築したモデルを利用する Vision サービスも利用できます。Vision サービスは OCR(画像中の文字認識)や画像からの一般的な視覚的特徴の抽出(特定のブランドや物体、人物の検出など)の用途に向いています。
Azure AI Document Intelligence
Document Intelligence では手書きの文書や印刷されレイアウトの付いた文書、記入済みのフォーム(書式)などのドキュメントを読み取って、データを抽出することができます。例えば雑誌や書籍のページの画像から、ページ内のテキストや表をデータとして取り出せます。
以下の例では表の画像から表形式のデータ(JSON 形式)を抽出しています。
Document Intelligence では一般的な文書からテキストやレイアウトを抽出する「ドキュメント分析モデル」に加えて、請求書や領収書、パスポートやID カード、保険証、契約書、クレジットカードなどの特定の様式の文書からより高い精度でデータが抽出できる「事前構築済みのモデル」と、利用者がラベル付きデータセットを使用して学習させることができる「カスタムモデル」が用意されています。
用途や目的に応じて適切なモデルを選択してアプリケーションを構築することで、より実用性の高いドキュメント認識を行うことができます。
Document Intelligence は以前「Form Recognizer」と呼ばれていました。
Azure AI Language
Language は、テキストを理解し分析するための自然言語処理 (NLP) 機能を提供します。
提供される機能にはさまざまなものが含まれますが、代表的な機能として以下のようなものがあります。
-
語句の分類:
テキスト内に含まれる語句を、定義されているいくつかのカテゴリー(人の名前、役職、場所、組織名、歴史的・社会的出来事、製品名、住所、電話番号、メールアドレス、日付など)に分類します。
-
個人情報(PII)・健康情報(PHI)の検出:
個人情報や健康情報として取り扱うべき名前や電話番号、メールアドレス、社会保険番号や個人番号などの ID などの情報を識別・分類・編集します。
-
言語検出:
テキストがどのような言語で書かれているかを検出します。
-
感情分析とオピニオン マイニング:
テキストをマイニングして正または負の感情に関する手がかりを得ることができます。例えば人々がブランドやトピックについてどう考えているかを知ることができます。
-
質問応答:
ユーザーからの入力に対して最も適切な回答を見つける機能です。ソーシャル メディア アプリケーション、チャット ボット、音声対応デスクトップ アプリケーションなどの会話型アプリケーションで利用できます。
Copilot のような生成 AI での、質問の都度生成される応答ではなく、事前構築済みまたはカスタム構築した知識ベースを利用した一定の回答を行うので、常に正確な回答を行う必要がある質問応答に適しています。
これらの機能を利用して、自然言語を取り扱うアプリケーションやサービスを構築できます。
Azure AI Language には、以前「Text Analytics」「QnA Maker」「Language Understanding (LUIS)」と呼ばれていた機能が含まれています。
Azure AI Search
AOAI や Azure Machine Learning で作成したカスタムモデルなど、AI のモデルを使用したアプリケーションをさまざまなコンテンツ(ファイル、メッセージ、チャット、メディアなど)を検索したい場合があります。
また AOAI で利用する ChatGPT のような大規模言語モデルに対して追加のグラウンディングデータを提供して拡張する RAG(Retrieval Augmented Generation、取得拡張生成)では、追加したいデータのベクトル検索結果が必要となります。
このような目的のために利用できるサービスが Azure AI Search です。AI Search は Azure 内のデータだけでなく SharePoint Online や オンプレミスのファイルサーバー、サードパーティのクラウドサービスなどさまざまな場所のデータに対するインデックスを作成し、フルテキスト検索・ベクター検索およびこの2つを組み合わせたハイブリッド検索を行うことができます。
SharePoint Online への接続は現在プレビューです。オンプレミスのファイルサーバーやサードパーティのクラウドへの接続にはサードパーティ製コネクタが必要です。
詳しくは以下を参照してください。
また AI Search では「AI エンリッチメント」と呼ばれる機能で、AI による分析と推論を使用して生の形式では検索できないコンテンツから検索可能なコンテンツや構造を作成できます。これにより検索を通じて他の Azure AI サービスが利用できるコンテンツをより豊富にし、AI の機能を高めることができるようになります。
まとめ
Azure AI サービスには Azure OpenAI サービス(AOAI)を含む幅広い AI サービスが含まれています。またこれらの AI サービスを組み合わせることで、より強力かつ柔軟な AI アプリケーションを構築することが可能になります。
いずれのサービスも事前構築済みのモデルが提供されており、またそのカスタマイズも容易に行えるようになっています。そのため AI や機械学習についての専門的な知識を持たない開発者でも、AI を利用したアプリケーションやシステムの構築が行えるようになっています。
DX の推進とそれを通じたより良いサービスの提供はこれからのビジネスに不可欠と言われています。こうした課題には AI の活用が欠かせません。Azure AI サービスはそうした AI 活用の大きな味方となるサービスです。ぜひ利用を検討してください。
AOAI を含む Azure AI サービスやその他の Azureサービスの利用、サブスクリプションの取得などクラウド活用についてのご相談は、当社担当営業までお気軽にご相談ください。