Azure OpenAI AOAI 2.0 : 11 透過 Prompt 產生圖片

對於想要透過文字提示詞，來產生圖片的需求，Azure OpenAI 服務提供了一個功能，可以透過文字提示詞，來產生圖片。那就是透過與使用 Dall-e-3，其是一個強大的 AI 模型，能夠根據文字描述生成高品質、逼真的圖像。透過 Azure OpenAI 服務，您可以輕鬆地將這個功能整合到您的應用程式中。

若想要使用這樣功能，首先需要在 Azure OpenAI 服務中建立一個 Dall-e-3 模型，然後透過這個模型，來產生圖片。完成部署 Dall-e-3 模型之後，您將會獲得一個 API 金鑰，這個金鑰是您用來呼叫 Dall-e-3 API 的憑證，並且需要保存該服務的 Endpoint，這兩個資訊將會於等下開發時候會用到。

在這篇文章中，將會展示出如何使用 Dall-e-3 模型，來產生圖片的做法。

建立測試專案

請依照底下的操作，建立起這篇文章需要用到的練習專案

打開 Visual Studio 2022 IDE 應用程式
從 [Visual Studio 2022] 對話窗中，點選右下方的 [建立新的專案] 按鈕
在 [建立新專案] 對話窗右半部
- 切換 [所有語言 (L)] 下拉選單控制項為 [C#]
- 切換 [所有專案類型 (T)] 下拉選單控制項為 [主控台]
在中間的專案範本清單中，找到並且點選 [主控台應用程式] 專案範本選項
專案，用於建立可在 Windows、Linux 及 macOS 於 .NET 執行的命令列應用程式
點選右下角的 [下一步] 按鈕
在 [設定新的專案] 對話窗
找到 [專案名稱] 欄位，輸入 csGenerateImage 作為專案名稱
在剛剛輸入的 [專案名稱] 欄位下方，確認沒有勾選 [將解決方案與專案至於相同目錄中] 這個檢查盒控制項
點選右下角的 [下一步] 按鈕
現在將會看到 [其他資訊] 對話窗
在 [架構] 欄位中，請選擇最新的開發框架，這裡選擇的 [架構] 是 : .NET 8.0 (長期支援)
在這個練習中，需要去勾選 [不要使用最上層陳述式(T)] 這個檢查盒控制項
這裡的這個操作，可以由讀者自行決定是否要勾選這個檢查盒控制項
請點選右下角的 [建立] 按鈕

稍微等候一下，這個背景工作服務專案將會建立完成

安裝要用到的 NuGet 開發套件

因為開發此專案時會用到這些 NuGet 套件，請依照底下說明，將需要用到的 NuGet 套件安裝起來。

安裝 Azure.AI.OpenAI 套件

請依照底下說明操作步驟，將這個套件安裝到專案內

滑鼠右擊 [方案總管] 視窗內的 [專案節點] 下方的 [相依性] 節點
從彈出功能表清單中，點選 [管理 NuGet 套件] 這個功能選項清單
此時，將會看到 [NuGet: csGenerateImage] 視窗
切換此視窗的標籤頁次到名稱為 [瀏覽] 這個標籤頁次
在左上方找到一個搜尋文字輸入盒，在此輸入 Azure.AI.OpenAI
在視窗右方，將會看到該套件詳細說明的內容，其中，右上方有的 [安裝] 按鈕
請確認有取消 Pre-release 這個選項，與選擇 2.0 正式版
點選這個 [安裝] 按鈕，將這個套件安裝到專案內

修改 Program.cs 類別內容

在這篇文章中，將會把會用到的新類別與程式碼，都寫入到 [Program.cs] 這個檔案中，請依照底下的操作，修改 [Program.cs] 這個檔案的內容

在專案中找到並且打開 [Program.cs] 檔案
將底下的程式碼取代掉 Program.cs 檔案中內容

using Azure.AI.OpenAI;
using OpenAI.Chat;
using OpenAI.Images;
using System.ClientModel;
using static System.Net.Mime.MediaTypeNames;

namespace csGenerateImage;

internal class Program
{
    static void Main(string[] args)
    {
        // 讀取環境變數 AOAILabKey 的 API Key
        string apiKey = System.Environment.GetEnvironmentVariable("AOAIImageKey");
        AzureOpenAIClient azureClient = new(
            new Uri("https://vulca-m2mwld4n-australiaeast.openai.azure.com/"),
            new System.ClientModel.ApiKeyCredential(apiKey));
        ImageClient imageClient = azureClient.GetImageClient("dall-e-3");

        string userPrompt = "一隻在天上飛的蟑螂";
        Console.WriteLine($"{DateTime.Now}  [User]: {userPrompt}");
        ImageGenerationOptions options = new()
        {
            Quality = GeneratedImageQuality.High,
            Size = GeneratedImageSize.W1792xH1024,
            Style = GeneratedImageStyle.Vivid,
            ResponseFormat = GeneratedImageFormat.Bytes
        };
        GeneratedImage generatedImage = imageClient.GenerateImage(userPrompt, options);

        BinaryData bytes = generatedImage.ImageBytes;
        using FileStream stream = File.OpenWrite($"bug.png");
        bytes.ToStream().CopyTo(stream);
        Console.WriteLine($"{DateTime.Now}  [User]: {userPrompt} 圖片已經產生了");
    }
}

一開始還是同樣要建立型別為 [AzureOpenAIClient] 的 [azureClient] 物件，並且將 Azure OpenAI 的完成佈署的 Dall-e 模型的服務端點 Endpoint 與 API Key 傳入這個物件中。接著，透過這個物件，取得 [ImageClient] 物件，並且指定使用的模型為 dall-e-3。

現在完成好了準備工作，接下來就是要準備要產生圖片的提示詞，這裡使用了 string userPrompt = "一隻在天上飛的蟑螂"; 這個提示詞。

其中也用到 [ImageGenerationOptions] 這個物件，這個物件是用來設定圖片的品質、大小、風格與回應格式。這裡設定了圖片的品質 (屬性名稱為 Quality) 為 High、大小 (屬性名稱為 Size) 為 W1792xH1024、風格 (屬性名稱為 ) 為 Style、回應格式 (屬性名稱為 ResponseFormat) 為 Bytes。

其中，對於 [ResponseFormat] 這個屬性，他的型別為 [GeneratedImageFormat?]，底下是這個型別的定義，這裡將會使用到 Bytes 這個屬性值。

public readonly partial struct GeneratedImageFormat
{
    // CUSTOM: Renamed.
    /// <summary> Returned as bytes in a base64-encoded string. </summary>
    [CodeGenMember("B64Json")]
    public static GeneratedImageFormat Bytes { get; } = new GeneratedImageFormat(BytesValue);

    // CUSTOM: Renamed.
    /// <summary>
    /// Returned as a URI pointing to a temporary internet location from where the image can be downlaoded. This URI is
    /// only valid for 60 minutes after the image is generated.
    /// </summary>
    [CodeGenMember("Url")]
    public static GeneratedImageFormat Uri { get; } = new GeneratedImageFormat(UriValue);
}

接著使用了 imageClient.GenerateImage(userPrompt, options)，建立了一個 [GeneratedImage] 物件，該物件會依據所傳入的圖片的品質、大小、風格與回應格式與與提示詞文字，要求 Dall-e 模型來生成一張符合要求的圖片。

最後，透過 GeneratedImage 物件,來將其物件內所持有的圖片資料，進行產生圖片，並且將圖片存成 bug.png 的檔案。

執行測試專案

按下 F5 開始執行專案
將會看到輸出結果

當程式執行完畢後，將會看到一個 bug.png 的圖片檔案，這個圖片檔案就是透過 Azure OpenAI 服務產生的圖片

C# .NET Blazor MAUI Xamarin Research

2024年12月12日星期四