AIの驚くべき進化

9月26日付の日経新聞記事に「感情読み取る音声AI」「チャットGPT、反応速度“人間並み”」が掲載されていました。
チャットGPT4o(大規模言語モデル)とAlexaやSiri(従来型AI)の比較表も書いてありました。近い内にコールセンターではAIコンパニオンに代替されてしまいそうですが、悪用されると、とんでもないことになりそうです。

先日の会合でチャットGPT4oの能力を具体的に教えてもらい、「AIの進化速度」に驚きました。各自の分野での生成AIの活用状況の話になってくると、私のイメージをはるかに超えた実務活用化が進んでいることもわかってきました。とんでもないことが実用化されていることに驚きました。
ハルシネーション(幻覚:正しくない情報生成)防止、RAG技術(検索拡張生成:文書生成 AI LLMの情報源として別手段で最適な情報を取得してLLMに回答文を生成させ、その精度や信頼性を向上させる手法)、マルチモーダルAI化(画像・音声・テキストなど複数データ形式情報を関連付け統合的に処理)など聞いたことはある言葉ですが、全く理解できていないことを実感するとともに改めて知ることができました。

最も刺激を受けたことは、「CHATGPT4からCHATGPT4oへの変化」が想定以上の変化であることです。現在は“CHATGPT-oの英語紹介ビデオがあり、解説をしてもらいながら観たのですが、マルチモーダルAI化&レスポンス速度においても人間同士の対話レベルにあり、既にとんでもない進化が起きています。
興味のある人は確認しておくことをオススメします。(9月後半に日本語版紹介ビデオがリリースされるとのこと (21) Introducing GPT-4o - YouTube