最近のAI関係を少しチェック

３Dモデルの生成

昨年から徐々に本格化してきた3Dモデルの生成AI。
一枚の画像や、複数の画像からモデルを作成することができる。１枚からの場合は複数パターンを生成した後に3Dモデルを生成するといった感じのため、生成した別角度に不都合も多くでる傾向があるため、複数の画像からの場合の方が完成度は上がるものと思う。
ただ、現在のクオリティーでは実用域での使用には堪えるものではない。現状はモデル修正とデータ最適化のための人員が必須となる。

下にある X のポストでは、一枚の画像から生成したモデル(画像左)を、ZBrushで加工したものとを比較している。元の生成したモデルは画像を見てもわかるように、使用できる状態には無い。
それでもモデリング時のベースモデルとしては “切っ掛け” として十分に有効なものと判定することはできる。

3Dモデル生成AIの実用性

現状でもいまだ「ベースとしては使える」レベルではないか…といった感じかと思います。
スペシャルな完成度になることも確率的にはありますが、ほぼ大半は大きく手を入れないとNGなレベルかと思います。
Tripo3D、Hunyuan3D等々の5つで試しましたがどんぐりの背比べでした。 pic.twitter.com/Fz19o9NKJ9
— Yanagishima HiD (@Yanagishima_HiD) April 20, 2025

音声でのAIとのやりとり

ブラウザーなどで音声によるやり取りができるようになってきた昨今、ただまだそれらをUnrealEngine等の外部と連携させるにはハードルが高い。結果としては現在はスクリプト等を使用したやり取りを介した手法をとる他わない現状がある。
そこで少しChatGPTとの音声でのやり取りの仕組みを勉強してみる。

やってみるとリアクションタイムのレスポンスが厳しい。
専用ではなくChatGPTのサービスを利用し、尚且つ　音声入力 > テキスト > [通信] > ChatGPT > [通信] > テキスト > 音声　としているため処理に無駄も多い点があるかと思う。
ローカルで音声からテキスト等の変換作業をおこなうのではなく、ChatGPTの “音声モード(サーバー側で処理)” のサービスをうまく利用するような手段とった方が、今後はよい結果が出るのではないかと考えている。

今はチャットボットのデジタルヒューマン関係の仕事がメインとなっているため、自分がやるわけではないけれど勉強も兼ねてChatGPTを使用した問答がどういった仕組みなのかを勉強してみる。

■.bat+Python
マイク音声入力(PC) >>> ChatGPT >>> 音声OUT(PC)

音声関係は VOICEVOX ENGINE を使用。 pic.twitter.com/XT6Aw4MJgM
— Yanagishima HiD (@Yanagishima_HiD) April 19, 2025

月	火	水	木	金	土	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30

最近のAI関係を少しチェック

３Dモデルの生成

音声でのAIとのやりとり

いいね:

関連

アーカイブ( 2005年～20XX年 )

タグ

３Dモデルの生成

音声でのAIとのやりとり

共有:

いいね:

関連

アーカイブ( 2005年～20XX年 )

タグ