AI SaaS

業務で使えるプライベートAIチャット「Azure Chat」でペルソナ、Extension、DALL-E3, GPT-4 Turbo with Visionが利用出来るようになりました

IDチームの前田です。

今回はこれまでも何度か紹介してきたMicrosoft社製プライベートAIチャットのAzure Chatが2024年02月に大幅アップデートし、ペルソナ(人格設定)、Extension(拡張機能)、DALL-E3(画像生成), GPT-4 Turbo with Vision(画像認識)が使えるようになりました。
OpenAI ChatGPT Plusや同じOSSのChatbot UIと比べるとUIや機能面でかなり劣っていたAzure Chatですが、今回のアップデートで差を詰めつつあります。

3行まとめ

  • Azure Chatが2024年02月に大幅アップデートし、ペルソナ(人格設定)、Extension(拡張機能)、DALL-E3(画像生成), GPT-4 Turbo with Vision(画像認識)が使えるようになりました
  • これまでせっかく社内環境に構築してもチャットだけで使い所の少なかったAzure Chatの機能が充実してきて、ようやく業務用途で利用できるようになりました
  • OpenAI ChatGPT Plusには機能的にまだまだ及ばないものの、業務で利用出来るプライベートAIチャットとして引き続き今後の進化に期待

Azure Chatとは

  • Azure Chatは、Microsoft社製のプライベートAIチャットで、Azure上やオンプレ環境で稼働させることが出来ます。
  • Azure OpenAIを利用し、Azure内や閉域網で通信が完結するため、セキュリティ面での利点があります。
  • Microsoft Entra IDとの連携も容易で統制されたAIチャットを構築することが出来ます。

既存環境のアップグレード手順

当社はすでにAzure上でAzure Chatを稼働させていたため、下記の手順でアップグレードしました。
特にAPIキーの環境変数名が OPENAI_API_KEY から AZURE_OPENAI_API_KEY になっており、こちらの変更をしないと動作しないため、注意が必要です。

  • https://github.com/microsoft/azurechat のmainブランチの内容をデプロイ
    • 当社は該当RepoをForkし、Github Actions経由でデプロイするようにしているため、Fork元のmainブランチに追従し、デプロイブランチにPushすることでアップグレードを実施しました
  • 環境変数名が変更になったり、新規に追加されたサービスを利用するために手動で必要な作業があったため、公式ドキュメントに従い作業

アップデート後のUI

アップデート後のUIは牡蠣のような形。通常のチャットに加え、導入済のExtensionsやペルソナが表示され、Start chat で利用出来るようになっています。

以前のUIは下記のような形。

ペルソナ

公式サンプルとしては 英仏の翻訳家ReactJSの専門家 が用意されており、独自ペルソナを作成する際の参考になります。

試しにAzure ADの専門家のペルソナを作成してみました。

ペルソナを用意しておくと、余計なやりとりを省きいきなり質問が出来ます。

Azure ADとEntra IDの違いについて質問したところ、「ハルシネーション(もっともらしいウソ)」が発生。

ちなみにMicrosoft Entra IDとは、旧名称「Microsoft Azure Active Directory」が2023年10月1日より、内容や機能は変わらず、名称が変更されたものでAzure OpenAI GPT-4が持っているデータよりも新しい情報のため知らなくて当然です。(Azure OpenAI GPT-4は2022年01月までのデータしか学習していないため、最新の情報は期待出来ません)

生成AIでは検索エンジン的な使い方はそもそも向いていないため、最新の情報を調べつつ、生成AIにまとめてもらうには次で紹介するExtensionを利用すると良いでしょう。

Extensions

いわゆるFunction Calling機能で、内部APIや外部サービスを呼び出しが可能になりました。
公式サンプルとしてBing Search APIが用意されており、APIキーを設定することで利用が可能です。(APIキーの保存にAzure Key Vaultの設定が別途必要)

同じ質問をするとこちらはBing Search APIを利用し、最新の情報を取得し、生成AIでまとめてくれているため回答は正確です。

Bing Search APIから返ってきた情報の確認も可能のため、一次ソースを確認することも出来ます。

APIが用意されているサービスであれば自前でExtensionを用意して、Azure Chat上で利用出来るため、さらに業務活用が広がりそうです。

画像生成 DALL-E3

Azure OpenAIのDALL-E3をAzure Chat上から利用出来るようになりました。2024/02/26現在、日本リージョンでDALL-E3が利用出来ないため、対応しているリージョンにDALL-E3を用意する必要があります。

「〇〇のイラストを描いてください」と指示を出すと画像が生成されます。試しにお寿司のイラストを描いてもらいましたがなんだかゾワゾワする感じです。
謎の説明文も付加されており、意図した画像を生成するにはプロンプトエンジニアリングが求められます。

画像認識 GPT-4 Turbo with Vision

GPT-4 Turbo with Visionとは

GPT-4 Turbo with Vision は、OpenAI によって開発された大規模マルチモーダル モデル (LMM) であり、画像を分析し、それらに関する質問に対するテキスト応答を提供できます。 自然言語処理とビジュアル解釈の両方が組み込まれています

https://learn.microsoft.com/ja-jp/azure/ai-services/openai/how-to/gpt-with-vision

Azure Chat上で画像をアップロードすると、画像認識が行われ、画像に関する質問に対するテキスト応答が返ってきます。

試しに筆者が利用してるカスタムキーボードの画像について分析して貰いました。

課題

アップデート作業の手間

今回の大幅なアップデートでかなり使えるようになりましたが、Azure Chatは構築やアップデート作業が簡単とは言えず、AzureやGitHubになれていないと運用が難しい印象があります。
新規構築の際は必要なリソースがいっぺんに作成されるため大きな問題は発生しないと思いますが、特にアップデートの際に、追加された機能のリソースは手動で作成する必要があるため、それなりの手間がかかりました。
今後アップデート用の仕組みが提供されることに期待します。

トークン数の制限とコスト

アップデート直後はGPT-4(8K)で動かしていましたが、頻繁にトークン数制限にかかっていたため、コストが2倍になりますがGPT-4(32K)で動かし利用しています。
モデルの使い分けが出来ないため、すべての質問に対してGPT-4(32K)を利用することになるため、こちらもコスト監視が必須です。

これまでプライベート環境で動く低機能なAI Chatという印象が強かったAzure Chatですが、今回のアップデートで業務活用が出来るレベルになったので当社でも積極的に活用していきます。

glidenote

memolist.vim作者. GMOペパボ、Kaizen PlatformといったWEB系スタートアップでシニアエンジニア、SRE Group Manager、Engineering Group Managerを歴任。AWS Certified Security – Specialty.
Speed Cube初心者 1/5/12=19.21/29.70/30.27。ばね指治療中