株式会社ずんだもん技術室AI放送局 podcast 20250925 Podcast Por  arte de portada

株式会社ずんだもん技術室AI放送局 podcast 20250925

株式会社ずんだもん技術室AI放送局 podcast 20250925

Escúchala gratis

Ver detalles del espectáculo
youtube版(スライド付き) 関連リンク Why we built the Responses API OpenAIは、GPT-5のような最新の推論モデルや、今後のAIエージェント開発に最適な新しいAPI「Responses API」を発表しました。このAPIは、過去のAPI(Completions、Chat Completions、Assistants API)の経験から、開発者がモデルとより強力かつシンプルに連携できるように設計されています。特に、テキスト、画像、音声などを扱えるマルチモーダル(複数の情報形式を扱える)な推論モデルに最適化されています。 Responses APIの主な強み 推論状態の永続化: Responses APIの最大の特徴は、モデルの「推論状態」(モデルが考えたことの記録)を複数のやり取り(ターン)にわたって保持できることです。これは、まるで探偵が事件解決時に途中の調査メモを継続的に活用し、次のステップに進むようなイメージです。 これまでのChat Completionsではターンごとに推論がリセットされていましたが、Responses APIでは保持されるため、モデルはより効率的かつ高性能に動作します。これにより、ベンチマークで約5%の性能向上、キャッシュ利用効率も大幅に改善されます。 詳細な出力情報: モデルがユーザーに「何を言ったか」という最終的なメッセージだけでなく、「何をしたか」(例えば、どのツールを呼び出したか、途中のステップ)といった行動履歴も構造化されたリストとして出力されます。これにより、開発者はモデルの動作を詳細に把握でき、デバッグや監査、表現豊かなユーザーインターフェースの構築が容易になります。 強化されたホストツール: file_searchやcode_interpreterに加え、web search、image genなどの新しいツールがOpenAIのサーバー側で提供されます。ツール実行がサーバー内で完結するため、開発者は複雑なツール連携を自前で実装する手間が省け、通信の往復回数が減り、処理速度の向上とコスト削減に繋がります。 推論過程の安全な管理: モデルの思考過程(Chain-of-Thought)は、誤った情報(ハルシネーション)や不適切な内容が出力されるリスクを避けるため、直接クライアントには公開されず、OpenAIの内部で安全に保持されます。これにより、モデルの思考を監視・利用しつつ、安全で信頼性の高い応答をユーザーに提供できます。 OpenAIは、Responses APIが「ステートフル(状態を保持する)」、「マルチモーダル」、「効率的」であると強調しています。Chat Completionsも引き続き利用可能ですが、永続的な推論、ネイティブなマルチモーダル対応、シンプルなエージェントワークフローを求めるなら、Responses APIが最適です。OpenAIは、このAPIが今後のモデル開発のデフォルトになると考えています。 引用元: https://developers.openai.com/blog/responses-api/ StrandsAgents+AgentCore Memory で私好みのエージェントを実現する この記事では、ユーザーの好みや過去の会話を記憶し、よりパーソナルな対応ができるAIエージェントの作り方について解説しています。特に、AIエージェント開発を支援する「Strands Agents」と、AWSが提供する「Bedrock AgentCore」の「Memory」機能を組み合わせて実現する方法が紹介されています。 Strands Agentsは、AIエージェントの振る舞いや会話の流れを柔軟に設計できるフレームワークです。これに、エージェントの実行環境や各種ツールとの連携、そしてユーザーごとの記憶管理機能を提供するBedrock AgentCoreを組み合わせます。Bedrock AgentCoreの目玉機能の一つが「AgentCore Memory」で、エージェントに短期記憶だけでなく、ユーザーの「Pythonが得意」「Angularが好き」といった好みを「長期記憶」として覚えさせることができます。この長期記憶は、過去の会話から得られた事実を記録し、現在の会話に関連する情報だけを動的に検索して活用するのが特徴です。 記事では、実際にMemory機能の有無でエージェントの応答がどう変わるかを検証しています。Memory機能がないエージェントは、一度会話を終えて新しいスレッドで同じような依頼をしても、ユーザーの以前の好みを忘れて、関係のない技術(例: Streamlit)を提案してしまいました。しかし、AgentCore Memoryを有効にしたエージェントは、新しい会話でも「PythonとAngularでの開発に興味がある」...
Todavía no hay opiniones