2023年6月30日金曜日

ChatGPT PluginをGeneXusで作ってみた。その2

 先日作成したChatGPT Pluginをあれこれ使ってみて気が付いた事を書きます。

TodoプラグインのTodo取得APIはユーザー名のフィルタリングだけで、他には特に機能的なものは実装していません。シンプルなリストデータを返すAPIです。

しかし、ChatGPT自体がデータ処理が可能なので、要求(プロンプト)に応じてAPIの機能に無い処理をしてくれます。

・Todoの期限ごとにカウント表示


・完了済みのTodoは除外して表示


・直近の期限のTodoを表示


・期限でソートして表示


・表形式で出力




こうなってくると、プラグイン側で実装する機能範囲と、ChatGPT側で処理をしてくれる範囲の境界線をどう考えたら良いのか? ある程度経験値が溜まらないとパッと判断するのは難しいですね。

もしくは、そんなに難しく考えない方がよいのでしょうか? 最初はゆるい感じでプラグインを作っておき、テストしながらChatGPT側で難しそうor重そうな場合はプラグイン側に寄せる。といったチューニング的な感じで進めるのが良いのでしょうかね。

では。

2023年6月27日火曜日

ChatGPT PluginをGeneXusで作ってみた。

 ずいぶん前に申請していたChatGPTのPlugin developerがようやく招待されたので試してみました。


まずはPlugin Quick Startとして公開されているサンプルを使って実装しました。ソースは以下のGithubになります。(実装および動作確認はここでは省略します)

https://github.com/openai/plugins-quickstart

サンプルがうまく動作したら、同じものをGeneXusを使って実装してみました。サンプルでは登録したTodoデータはメモリ上にしか保持しない仕様になっていますので、サービスを再起動するとデータは失われてしまいます。GeneXusで同じ機能を実装するのであれば、Todoデータはデータベースに登録しておきたいですよね。

という事で、ナレッジを新規作成したらまずはTodoトランザクションを定義します。


  • 主キーはユーザー名+TodoNoの複合キー
  • Todo(Description)以外に完了予定日(DueDate)、完了フラグ(IsDone)、完了日(DoneDate)を追加

続いてAPIオブジェクトを作成し、I/Fを定義します。


サンプルでは、Todo一覧取得、Todo登録、Todo削除だけでしたが、DB化するのでTodo更新機能も追加し、Todo内容の変更や完了登録が出来るようにします。

あとは、それぞれのAPIに対応するプロシージャオブジェクトとパラメータであるSDTを作成します。このあたりは通常のGeneXus開発と変わりませんので、内容の紹介は割愛しますが、サンプルと比較して違う点だけ書き留めておきます。

  • サンプルでは機能ごとにHTTP Methondを指定していました。例えば、Todo削除はDELETEなど。GeneXusのAPIオブジェクトでもRestMethodのアノテーション記述が出来るのですが、DELETE指定の場合、ChatGPTとの連携がうまく出来ませんでした。従って、上記のAPIオブジェクト定義では登録・更新・削除は全てPOSTにしています。
  • サンプルのTodo登録機能では、ユーザー名はHTTPパラメータ、TodoはPost valueと使い分けているのですが(HTTPパラメータはURLRewriteでパス(=ユーザー名)にマッピングさせるため)、GeneXusのプロシージャオブジェクトは、パラメータは全てPost valueになるのと、ユーザー名はプリミティブ変数、その他Todo項目はSDTという複数パラメータがうまく認識されなかったので、送信データは全て一つのSDTに纏めています。



基本的には以上でプラグイン機能の出来上がりです。ビルドしてPostMan等のRestテストツールで動作確認をします。


次にChatGPT Pluginとして登録するのに必要なファイルの定義です。

  • マニフェストファイル(ai-plugin.json)
    • ChatGPTがPluginをインストールした時に読み込むファイルで、Pluginの基本的な説明と、APIの定義情報が書いてあるyamlファイルの場所、ロゴ画像ファイルの場所が記述してあります。こちらはほぼサンプルと同じ内容で場所の指定のみPluginを配置するサーバーの内容に変更しました。
  • yamlファイル(openapi.yaml)
    • APIのインターフェース定義がされているyamlファイル(Open API Documentフォーマット)です。
    • 今回、一番ハマったのはこのファイルでした。yamlファイルはGeneXusでもAPIを作成するとビルド時に自動生成してくれますが、フォーマットは同じでも記述内容が微妙にChatGPTが要求するものと違っており、トライ&エラーで動作するようになりました。以下、ポイントです。
      • operationId GeneXusが生成する内容は「APIオブジェクト名.API名_メソッド」という書式ですが、ChatGPTでは「.」ドットは受け付けておらず、アンダースコアに変更する必要がありました。
      • schema  パラメータをSDTとして定義する場合、GeneXusはyamlの定義をAPI定義→(参照)→パラメータ定義→(参照)→SDT定義(JSONオブジェクト)という風に三段階の参照($ref)で定義します。これがChatGPTでは認められず、二段階(一つの参照のみ)に変更する必要がありました。且つ、type:objectが不足していましたので、こちらも手動で追加しました。
      • description ChatGPTがどうPluginを使うか? はdescriptionの書き方に依存します。特にパラメータとなる各項目の説明は単に名称だけだとこちらの想定通りの挙動にならず(もちろん、名前から推測はしてくれますが)、特に更新や削除をする時に主キー項目は、「データ取得時の主キー項目を使い回すように」といった念押しのような説明の記載をしないと、ChatGPTが適当な値を主キーとして設定するため、更新が空振りしてしまう事態となりました。
  • アイコンファイル
    • Pluginリストや選択時のPluginを識別するためのアイコン画像です。今回は、サンプルにあったTodoアイコンの背景画像をGeneXusっぽく赤色に変更したものを使ってみました。

Pluginに必要なファイルが出来たらデプロイしたアプリの然るべき場所に配置します。

いよいよ、ChatGPTにPluginをインストールします。Plugin developerとして認証されると、Plugin storeにオプションが増え、未認証のPluginや自分で開発したPluginを自由にインストール・使用する事ができるようになります。Pluginをデプロイしたurlを指定します。(Pluginの呼び出しはブラウザ上で行われているようで、localhostも指定出来ます)




では、使ってみましょう。


この様に、TODOリストの一覧表し、登録、更新、削除が会話ベースで行えます。さらに、今回のPluginはユーザー名を主キーとしてテーブルを作成してあるので、ユーザーを切り替えて使う事も出来ます。(認証の仕組みは作っていないので、自動的な設定は出来ていませんが)



色々と試してみて判ったのは、ChatGPT自体が代名詞や文脈を理解するので、Todo情報を正確に記載しなくても「期限は来週月曜日」とか「完了日は昨日」といった指示する側が日常会話レベルの内容でも正しく動作してくれるのがAIらしい使い方だと思いました。


テキストベースではありますが、自然言語でPluginアプリが操作できるという事は、例えばスマホの音声入力を使えば、いちいちキーボーとから打ち込まなくても話し言葉でアプリが操作できますし、その応用編としてはAmazon AlexaやGoogle Echoといったスマートスピーカーに組み込む事が出来るようになれば「何を言っているのか判りません」といったつれない返事によるイライラから解消されるかもしれません。ChatGPT Pluginが飛躍的に活用されるのはこんなユースケースな気がしました。


何かアイディアが思いついたら新しいPluginを作ってみたいと思います。

では。



2023年6月5日月曜日

ミーガン(M3GAN)は電気羊の夢を見るか

 今回の記事は映画ネタです。ネタバレが無いように書いたつもりですが、感想を書く時点でネタバレしてる可能性大なので、これから見ようと思っている人は見た後に読んでください。(笑)


ウルグアイまでの長いフライトの中で見た映画「ミーガン(M3GAN)」がとても面白かった。日本でももうすぐ公開かな。M3GANとはModel 3 Generative Android の略。学習型のaiを搭載したアンドロイドが巻き起こすサイコスリラーもの。この時期に上映とはタイミングが良すぎる。

エンジニア目線で見ると色々とツッコミたくなる部分があるけれど、それはさておき、ミーガンが主人公の女の子と接しながら学習し、守りたい(母性というのか?)感情や独占したい感情が芽生えてきて、少しづつ行動がやばくなっていくのが見ててゾクゾクした。

思考は感情なのか?思考するAIは感情を持っていると言えるのか?

一方で、心に傷を負った少女がミーガンと接することで癒やされてきたのも束の間、今度はミーガン依存症になってしまうあたりは、今どきのスマホ依存症を見れば十分あり得る副作用だし、幼少期からケアをアンドロイド任せにしていると、リアルな友達より自分を喜ばせてくれるアンドロイドを選んでしまう可能性(危険性)を気づかせてくれた。

まあ、エンジニアがよかれと思って技術を駆使するとろくでもない事が起きるのは今も昔も変わらない話か。

人類を攻撃するAIと言うとターミネーターのように世界を滅ぼすような大きなスケールがありがちだけど、人を補助するアンドロイド/aiが生活の中で反乱を起こす方がより身近で怖かった。

普通に考えたらロボット三原則とかOSに規制を入れるだろう?と思ってしまうが、自己学習が規制を乗り越えてしまう可能性もあるのか?アプリがOSすら書き換えてしまうのか?(それがシンギュラリティか?) 興味は尽きない。

あと、ミーガンのキモカワイイダンスとか走り方とか、アンドロイドの動きはCGと思いがちな所を女の子が演じているとは、映画の内容の逆をいく制作方法でニヤリとさせられる。

感想がつきないのでこのあたりで。

最後にすみません、今回はこのタイトルをネタにしたくて記事を書きました。

では。

2023年6月1日木曜日

システム開発とジェネレーティブAI: 生産性向上への新たな可能性

 【導入】

システム開発は巨大なプロジェクトであり、効率化と成果物の品質向上が求められます。最近、ジェネレーティブAIの登場により、コーディングや他のプロセスにおいて新たなアシスタント機能が生まれました。本記事では、システム開発におけるジェネレーティブAIの活用方法と、その効果について段階的に解説します。

【ステップ1: システム開発のプロセスとジェネレーティブAIの関係】 システム開発のプロセスを要件定義、設計、コーディング、テストの工程に分け、それぞれにおいてジェネレーティブAIの活用方法を検討します。要件定義においては、自動生成されたテストケースや要件ドキュメントの作成が可能です。設計では、AIによるデザインの自動生成や最適化が可能です。コーディング工程では、AIを用いたコード生成やテンプレートの活用が効果的です。テストにおいては、AIによるバグの自動検出やテストスクリプトの生成が効率化に寄与します。

【ステップ2: コミュニケーションの改善】 システム開発では、プロジェクトメンバー間の円滑なコミュニケーションが不可欠です。ここでは、ジェネレーティブAIが優れた道具として活用されます。例えば、自動要約機能を持つAIチャットボットを導入することで、プロジェクトの議事録やミーティングの要点を効率的にまとめることができます。さらに、質問応答システムを活用することで、プロジェクトメンバーが容易に情報を共有し、迅速な意思決定が可能となります。また、リアルタイムなコラボレーションをサポートする共同編集ツールやプロジェクトダッシュボードも利用することで、プロジェクトメンバー間のコミュニケーションとタスク管理を一元化し、効率化を図ることができます。

【ステップ3: プロセスの効率化と標準化】 各工程におけるプロセスの効率化と標準化も重要な要素です。ジェネレーティブAIを活用することで、コーディングの自動化や品質向上を実現できます。AIによるコード生成やテンプレートの利用、バグの自動検出などが効果的です。また、プロジェクト管理ツールにおいても、AIを活用することで自動化とアシスト機能を実現できます。以下は、AIを活用したプロジェクト管理ツールの具体的な機能です。

  1. タスク管理の自動化: AIがプロジェクトメンバーのタスクを自動的に割り当てたり、進捗状況を追跡したりすることができます。AIは優先順位やリソースの可用性などを考慮し、タスクの最適なスケジューリングを行います。

  2. リソース管理のサポート: AIはプロジェクトに必要なリソース(人員、予算、設備など)の管理をサポートします。AIはリソースの予測や最適化を行い、プロジェクト全体のリソースのバランスや適切な割り当てを助けます。

  3. リスク管理の予測と対策: AIはプロジェクトのデータや過去の経験を分析し、リスクを予測します。また、リスクに対する適切な対策や予防策を提案することもできます。これにより、プロジェクトのリスク管理を強化し、問題の早期解決やコスト削減に寄与します。

  4. コラボレーションとコミュニケーションの支援: AIを活用した共同編集ツールやコミュニケーションプラットフォームは、プロジェクトメンバー間のリアルタイムなコラボレーションを支援します。AIは共同編集の衝突を検出し解決するだけでなく、自動的にタスクの関係者への通知や進捗の共有などを行います。

  5. プロジェクトの進捗と予測の可視化: AIはプロジェクトの進捗状況や予測を視覚的に表示するダッシュボードを提供します。これにより、プロジェクトマネージャーや関係者はリアルタイムでプロジェクトの状況を把握し、必要な対策や判断を行うことができます。

【まとめ】 システム開発におけるジェネレーティブAIの活用は、生産性向上や品質向上に大きな可能性をもたらします。コーディングや他のプロセスの効率化だけでなく、コミュニケーションの改善やプロセスの標準化も重要です。AIの活用により、素晴らしい成果物を生み出すシステム開発プロジェクトにおいて、ジェネレーティブAIは強力なパートナーとなるでしょう。

【ブログ記事の締めの文章】 システム開発におけるジェネレーティブAIの進化は、プロジェクトの生産性と品質を向上させるための新たな可能性を開拓しました。コーディングの効率化、コミュニケーションの改善、プロセスの標準化、そしてプロジェクト管理ツールの自動化とアシスト機能は、システム開発プロジェクトにおいて大きな価値をもたらします。ジェネレーティブAIと協力しながら、より効率的で革新的なシステム開発を実現しましょう。

以上のように、システム開発とジェネレーティブAIの関係について具体的なステップやプロジェクト管理ツールの機能を交えながら解説し、最後にブログ記事の締めの文章を追加しました。これにより、読者がシステム開発におけるジェネレーティブAIのポテンシャルと可能性を理解し、将来のプロジェクトに活かすことができるでしょう。


ここ何回かのブログ記事ではウェブサイトの内容をチャットGPTに要約してもらうというものでしたが、今回はブログ記事そのものをチャットGPTに考えてもらいました。

以下がそのプロンプトになりますが、今回は今までのように一発で記事は書けていません。ちなみにモデルはGPT3.5です。










人からの要求というものは曖昧なもので「ブログ記事を書いてください」という単純なゴールだとチャットGPTでも記事を書くことができません。そのゴールに対してどんどん情報を追加してあげる、パラメータを追加してあげることによりGPTが曖昧なゴールをより正確なゴールとして認識することができ、そしてアウトプットを出力することができる。という流れです。いわゆるゴールシークと呼ばれる手法です。私はシュンスケさんからだいぶ勉強させて貰っています。

どうしたらChatGPTを使いこなせるか? そしてどんな事に適用出来るのか? もう少しトライを続けていこうと思っています。
では。