OpenAIは、高速かつ低コストな新しい小型言語モデル「GPT-4o mini」を発表しました。

GPT-4o miniは、従来モデルよりも大幅に低価格ながら、優れたテキスト処理能力を備え、今後、画像、音声、動画処理にも対応予定です。

とにかく早い!

GPT-4o miniの特徴

2024年7月19日にOpenAIから発表された「GPT-4o mini」は、『AIをより手頃な価格で提供し、幅広いアプリケーションでの利用を促進すること』を目的としています。

しかし、単に安価なだけでなく、MMLUで82%のスコアを達成し、GPT-4を上回るパフォーマンスを誇るなど、精度は決して低くなく、直近で発表されたGPT-4oには劣るものの、従来のGPT-4を上回る性能が確認されています。

高いコストパフォーマンス

コストパフォーマンスは圧倒的に改善されました。

GPT-4o mini は100万入力トークンあたり15セント、100万出力トークンあたり60セントという圧倒的低価格で、これは、GPT-4o どころか GPT-3.5 Turbo と比較しても60%以上安価になっています。

優れたテキスト処理能力

前述の通り言語理解ベンチマーク「MMLU」で82%という高いスコアを獲得し、以前の GPT-4 Turbo よりも優れた性能をしています。

このモデルは有償アカウントだけでなく、無料アカウントのGPT-3.5の代わりとしても提供されており、ChatGPTを無料で使う人にとっては大きな性能向上と言えるでしょう。

高速な処理速度

非常に高速なレスポンスが可能で、応答スピードを重視するアプリケーションに最適といえます。プログラミングを支援しコードの生成を行うツール「GitHub Copilot」を用いたテストでは、キーストロークのわずかな合間にコード補完候補を配信する際など、驚異的な速度が確認されました。

多言語対応

GPT-4oの改良されたトークナイザーを共有しており、英語以外のテキスト処理がより効率的になりました。

Azure AIでも提供

GPT-4o miniは、Azure AIでも利用可能になり、Azure OpenAI Serviceを通じて、以下の機能が提供されます。

料金

他のモデルと同様に、Azure環境においてもOpenAIからの提供と同じく、100万入力トークンあたり15セント、100万出力トークンあたり60セントで利用が可能となっています。

データの保存場所の柔軟性と制御

Azure AIを使うことで、データの保存場所と処理場所を柔軟に選択できるため、固有のコンプライアンス要件が求められる環境でもこのモデルを利用することができます。

高スループット

GPT-4o miniは負荷が大きく改善していることで多くの作業を短い時間で行うことができます。1分あたり1500万トークン、GPT-4oでは1分あたり3000万トークンを処理することが可能です。

安全性機能

 ヘイトスピーチ、アダルトコンテンツ、個人情報などを学習データから除外するなど、安全性対策も強化されています。

また、Azure AIでは、プロンプトシールドや保護された素材の検出など、Azure AIコンテンツセーフティ機能がデフォルトで有効になっています。

バッチサービス

オフピーク時の容量を利用することで、24時間以内の処理を50%割引で提供します。

ファインチューニング

特定のユースケースやシナリオに合わせてモデルをカスタマイズ可能です。

Azure AIは、GPT-4o miniの提供により、顧客がより手頃な価格で革新的なAIアプリケーションを開発・拡張できるよう支援していくようです。

まとめ

たくさんの可能性を秘めているChatGPT-4mini。すでに他のツールとの連携も始まっています。

AIツール「Dify」上で既に”GPT-4o mini”が選択可能に

処理速度が向上したことにより、「リアルタイム言語翻訳」が進んだり、教育現場における「インタラクティブな個別指導」が実現できたり、医療分野で「患者の症状や検査結果のリアルタイム分析」が実現できたり、この新たなモデルの登場により、AIの可能性は更に広がりそうです。