25/07/18 13:32:22.03 L2zxfVEE.net
OpenAIがChatGPTエージェントをリリース、ブラウザやAPIを駆使して複雑なタスクを複数ステップで実行可能
URLリンク(gigazine.net)
>>OpenAIによれば、ChatGPTエージェントはリモートブラウザーを使用してウェブサイトと直接対話できるリサーチプレビュー用のエージェントである「Operator」と、マルチステップのウェブ推論ツールである「deep research」の2つを組み合わせた発展形だとのこと。Operatorはウェブ上でスクロールやクリック、入力といった操作が可能な一方で、詳細な分析やレポート作成には限界がありました。それに対し、deep
>>researchは情報の分析や要約に秀でていたものの、ウェブサイトと対話しながら結果を絞り込んだり、ユーザー認証が必要な情報にアクセスしたりすることができませんでした。この2つを組み合わせることで、クリックやフィルターの適用などを通じて、ウェブサイトとより能動的に関わりながら、正確かつ効率的に情報を取得できるようになったとOpenAIは述べています。
>>AIの知能の限界をテストするためのベンチマーク「Humanity's Last Exam」では、ChatGPTエージェントの搭載モデルがスコア43.1%という記録を達成しました。これはOpenAI o3やdeep research単体のスコアを大きくしのいでいます。
>>データ分析とモデリングにまたがる現実的なデータサイエンスのタスクでエージェントを評価するDSBenchでは、「ChatGPTエージェントは従来の最先端モデルを大幅に上回り、特にデータ分析タスクでは人間のパフォーマンスを大きく超える結果を示した」とOpenAIはアピールしています。
>>ChatGPTエージェントはPro、Plus、Teamプランのユーザーを対象に段階的に提供されており、EnterpriseおよびEducation向けには2025年7月中に提供される予定です。Proユーザーであればほぼ無制限にタスクを実行でき、それ以外のプランでは1カ月当たり50件までのタスクを実行可能で、有償での追加使用もできるとのこと。利用可能であれば、ChatGPTエージェントは、入力欄にある「ツール」のドロップダウンメニューから選択できます。