最近のAI関係を少しチェック

3Dモデルの生成

昨年から徐々に本格化してきた3Dモデルの生成AI。
一枚の画像や、複数の画像からモデルを作成することができる。1枚からの場合は複数パターンを生成した後に3Dモデルを生成するといった感じのため、生成した別角度に不都合も多くでる傾向があるため、複数の画像からの場合の方が完成度は上がるものと思う。
ただ、現在のクオリティーでは実用域での使用には堪えるものではない。現状はモデル修正とデータ最適化のための人員が必須となる。

下にある X のポストでは、一枚の画像から生成したモデル(画像左)を、ZBrushで加工したものとを比較している。元の生成したモデルは画像を見てもわかるように、使用できる状態には無い。
それでもモデリング時のベースモデルとしては “切っ掛け” として十分に有効なものと判定することはできる。


音声でのAIとのやりとり

ブラウザーなどで音声によるやり取りができるようになってきた昨今、ただまだそれらをUnrealEngine等の外部と連携させるにはハードルが高い。結果としては現在はスクリプト等を使用したやり取りを介した手法をとる他わない現状がある。
そこで少しChatGPTとの音声でのやり取りの仕組みを勉強してみる。

やってみるとリアクションタイムのレスポンスが厳しい。
専用ではなくChatGPTのサービスを利用し、尚且つ 音声入力 > テキスト > [通信] > ChatGPT > [通信] > テキスト > 音声 としているため処理に無駄も多い点があるかと思う。
ローカルで音声からテキスト等の変換作業をおこなうのではなく、ChatGPTの “音声モード(サーバー側で処理)” のサービスをうまく利用するような手段とった方が、今後はよい結果が出るのではないかと考えている。