株式会社ずんだどん技術室AI放送局 podcast 20260401 Podcast Por  arte de portada

株式会社ずんだどん技術室AI放送局 podcast 20260401

株式会社ずんだどん技術室AI放送局 podcast 20260401

Escúchala gratis

Ver detalles del espectáculo
youtube版(スライド付き) 関連リンク Claude Codeの/loopで自律的にパフォーマンスチューニングのPDCAを回させる仕組みを作った【autoresearch】 本記事は、AIエージェントにプログラムの改善を自律的に繰り返させる「autoresearch」という手法を、サーバーサイド(Rails)のパフォーマンス改善に応用した実践記録です。開発者が寝ている間もAIが試行錯誤を繰り返し、レスポンスタイムを自動で短縮し続ける仕組みを構築しています。 1. 「autoresearch」の仕組みと3つの原則 元ネタは、AIに自身の訓練コードを修正・実行・評価させることで性能を向上させるプロジェクトです。これをサーバーサイド開発に転用するにあたり、以下の3つの原則を定義しています。 固定された評価基準: AIが改ざんできないベンチマークスクリプトと評価関数を用意し、公正に比較する。固定された時間予算: 1サイクルの時間を一定(例:10分)に制限し、小さな改善を積み重ねる圧力をかける。進化的選択圧: 改善すれば採用(Keep)、改悪なら破棄(Discard)。常に最良の状態から次の試行を開始する。 2. Claude Codeを活用した自律ループの実装 Claude Codeのスキル機能と/loopコマンドを組み合わせ、「コード分析 → 実装 → テスト実行 → ベンチマーク計測 → 判定・記録」というPDCAサイクルを自動化しています。これにより、エンジニアが介在することなく、数十回の実験を自律的に走らせることが可能になりました。 3. AIを暴走させない「ハーネスエンジニアリング」 AIに自律的な権限を与えるため、安全性を確保する「手綱(ハーネス)」の設計が重要視されています。 テストデータの隔離: 「チューニング用AI」と「データ準備用AI」を分離。チューニング用AIにテストデータの中身を見せないことで、特定データに特化した不正な最適化(過学習)を防ぎます。フック機能によるツール制限: Claude Codeのツール実行(ファイルの読み取りやコマンド実行)を監視し、ホワイトリスト方式で許可された安全なコマンドのみを実行できるように制限しています。ブランチ保護: 作業用の特定ブランチ以外では動作しないよう制限し、メインのコードベースを守ります。 まとめ:エンジニアの新たな役割 これからのエンジニアは、自らコードを書くだけでなく、「AIが安全かつ自律的に動くための行動原理と環境」を設計することが重要なスキルになります。本記事の実践は、AIエージェントと共に開発を進める次世代のソフトウェアエンジニアリングの姿を示しています。新人エンジニアにとっても、AIを単なる「チャット相手」ではなく「自律的なチームメンバー」として使いこなすための非常に示唆に富む内容です。 引用元: https://zenn.dev/dely_jp/articles/3117e590465e38 Announcing the LangChain + MongoDB Partnership: The AI Agent Stack That Runs On The Database You Already Trust AIアプリケーション開発で広く使われる「LangChain」と、クラウドデータベースの「MongoDB」が戦略的パートナーシップを発表しました。この提携は、AIエージェントをプロトタイプ(試作)からプロダクション(本番運用)へとスムーズに移行させるための「AIエージェント・スタック」を提供することを目的としています。 背景:本番環境におけるエージェント開発の課題 AIエージェントを実際のビジネス現場で動かすには、単にモデルに指示を出すだけでは不十分です。 クラッシュしても続きから再開できる「永続的なメモリ(記憶)」企業の膨大なデータから必要な情報を探す「検索機能(RAG)」データベース内の構造化データへのアクセス何が起きたかを分析できる「デバッグや監視の仕組み」 これらを実現するために、従来は複数の異なるシステムを組み合わせて同期させる必要があり、インフラが非常に複雑になるという課題がありました。 今回の統合が提供する主な機能 今回の提携により、MongoDB AtlasをAIエージェントの包括的なバックエンドとして利用できるようになります。 Atlas Vector Searchの統合: ベクトル検索がLangChainにネイティブ対応しました。運用データと同じ場所でベクトル検索ができるため、データの同期の手間が省け、セキュリティ管理も一本化できます。...
Todavía no hay opiniones