株式会社ずんだもん技術室AI放送局 Podcast Por 株式会社ずんだもん技術室AI放送局 arte de portada

株式会社ずんだもん技術室AI放送局

株式会社ずんだもん技術室AI放送局

De: 株式会社ずんだもん技術室AI放送局
Escúchala gratis

AIやテクノロジーのトレンドを届けるPodcast。平日毎朝6時配信。朝の通勤時間や支度中に情報キャッチアップとして聞いてほしいのだ。(MC 月:春日部つむぎ、火水木:ずんだもん、金:お嬢様ずんだもん)
Episodios
  • 株式会社ずんだもん技術室AI放送局 podcast 20260402
    Apr 1 2026
    youtube版(スライド付き) 関連リンク Holo3: Breaking the Computer Use Frontier 本記事は、自律型エンタープライズの実現を目指すH社が発表した、コンピュータ操作(Computer Use)に特化した最新AIエージェント「Holo3」の紹介記事です。Holo3は、デスクトップPCの操作能力を測る主要ベンチマーク「OSWorld-Verified」において、78.85%という業界最高水準のスコアを達成し、既存の巨大なプロプライエタリ・モデルを凌駕する性能を示しました。 【技術的な核心:Agentic Learning Flywheel】 Holo3の強みは、モデルの「知覚」と「意思決定」を継続的に磨き上げる「Agentic Learning Flywheel(エージェント学習の弾み車)」という特殊なトレーニングパイプラインにあります。 合成ナビゲーションデータ:人間とAIの指示に基づき、多様な操作例を生成。ドメイン外拡張:未知のUIや予期せぬ挙動にも対応できるよう、プログラムを用いてシナリオを増幅。厳選された強化学習(Curated RL):高度なフィルタリングを経たデータを用いた強化学習により、タスク実行の精度を最大化しています。 【実用性を支える「合成環境工場」と評価指標】 開発チームは、現実の企業システムを模した環境を自動生成する「Synthetic Environment Factory」を構築しました。コーディングエージェントがウェブサイトをゼロから構築し、そこで複雑なタスクをエージェントに実行させることで、実務に近い訓練を行っています。 さらに、独自の評価指標「H Corporate Benchmarks」を導入。これは、PDFから備品の価格を取得し、予算と照らし合わせ、個別に対象者へメールを送るといった、複数のアプリケーションを跨ぐ高度な推論と持続的な作業が必要な486のタスクで構成されています。 【効率的なモデル構成とオープン化】 Holo3-122B-A10Bは、122B(1220億)の総パラメータを持ちつつ、実行時に動くのは10B(100億)という効率的なアーキテクチャを採用しています。これにより、GPT 5.4やOpus 4.6といった超巨大モデルに比べて遥かに低コストで運用可能です。また、より軽量な「Holo3-35B-A3B」はApache 2.0ライセンスでオープン公開されており、誰でも利用・開発が可能です。 【新人エンジニアへのメッセージ】 「AIがPCを操作する」技術は、単なる自動化から、未知のソフトウェアをリアルタイムで学習・操作する「Adaptive Agency(適応型エージェント)」の段階へ進化しようとしています。Holo3のように軽量で高性能なオープンモデルが登場したことで、特定の業務に特化したエージェントを自分たちで構築・改善できるエキサイティングな時代が到来しています。最先端のベンチマーク手法や、合成データを用いた学習サイクルを理解することは、これからのエンジニアにとって大きな武器になるはずです。 引用元: https://huggingface.co/blog/Hcompany/holo3 Ubieにおける一年間のセキュリティ分析AIエージェントの運用 Ubie社が約1年間にわたり運用してきた、セキュリティ分析AIエージェント「Warren」の実践的な知見をまとめたドキュメントです。新人エンジニアの方にとっても、生成AIを実際の業務フローに組み込む際の「一歩進んだ活用術」として非常に参考になる内容です。 ■ セキュリティ分析とAIエージェント「Warren」 セキュリティ分析とは、EDRや脆弱性スキャナーなどのツールが検知した膨大な「アラート」を調査し、それが「本当に危険な攻撃(真の陽性)」か、あるいは「正当な業務による誤検知(偽陽性)」かを判断する業務です。従来は熟練のエンジニアが数十分かけてログを検索し、文脈を読み解く必要がありました。 これに対し、Ubieが開発した「Warren」は、Claudeなどの高性能なLLMを搭載したAIエージェントです。単なる要約ツールではなく、自らツールを使いこなして調査を完結させる能力を持っています。 ■ AIエージェント運用のメリット 圧倒的な情報収集スピード: AIはBigQueryへのクエリ実行、EDRのAPI連携、Slackの履歴検索、GitHub上のコード確認などを数分で並列実行します。人間が「どこに情報があったか」を思い出す手間をすべて代行し、認知負荷を大幅に下げてくれます。人間を超える誤検知の判定: 社内環境やログの詳細を突き合わせることで...
    Más Menos
    Menos de 1 minuto
  • 株式会社ずんだどん技術室AI放送局 podcast 20260401
    Mar 31 2026
    youtube版(スライド付き) 関連リンク Claude Codeの/loopで自律的にパフォーマンスチューニングのPDCAを回させる仕組みを作った【autoresearch】 本記事は、AIエージェントにプログラムの改善を自律的に繰り返させる「autoresearch」という手法を、サーバーサイド(Rails)のパフォーマンス改善に応用した実践記録です。開発者が寝ている間もAIが試行錯誤を繰り返し、レスポンスタイムを自動で短縮し続ける仕組みを構築しています。 1. 「autoresearch」の仕組みと3つの原則 元ネタは、AIに自身の訓練コードを修正・実行・評価させることで性能を向上させるプロジェクトです。これをサーバーサイド開発に転用するにあたり、以下の3つの原則を定義しています。 固定された評価基準: AIが改ざんできないベンチマークスクリプトと評価関数を用意し、公正に比較する。固定された時間予算: 1サイクルの時間を一定(例:10分)に制限し、小さな改善を積み重ねる圧力をかける。進化的選択圧: 改善すれば採用(Keep)、改悪なら破棄(Discard)。常に最良の状態から次の試行を開始する。 2. Claude Codeを活用した自律ループの実装 Claude Codeのスキル機能と/loopコマンドを組み合わせ、「コード分析 → 実装 → テスト実行 → ベンチマーク計測 → 判定・記録」というPDCAサイクルを自動化しています。これにより、エンジニアが介在することなく、数十回の実験を自律的に走らせることが可能になりました。 3. AIを暴走させない「ハーネスエンジニアリング」 AIに自律的な権限を与えるため、安全性を確保する「手綱(ハーネス)」の設計が重要視されています。 テストデータの隔離: 「チューニング用AI」と「データ準備用AI」を分離。チューニング用AIにテストデータの中身を見せないことで、特定データに特化した不正な最適化(過学習)を防ぎます。フック機能によるツール制限: Claude Codeのツール実行(ファイルの読み取りやコマンド実行)を監視し、ホワイトリスト方式で許可された安全なコマンドのみを実行できるように制限しています。ブランチ保護: 作業用の特定ブランチ以外では動作しないよう制限し、メインのコードベースを守ります。 まとめ:エンジニアの新たな役割 これからのエンジニアは、自らコードを書くだけでなく、「AIが安全かつ自律的に動くための行動原理と環境」を設計することが重要なスキルになります。本記事の実践は、AIエージェントと共に開発を進める次世代のソフトウェアエンジニアリングの姿を示しています。新人エンジニアにとっても、AIを単なる「チャット相手」ではなく「自律的なチームメンバー」として使いこなすための非常に示唆に富む内容です。 引用元: https://zenn.dev/dely_jp/articles/3117e590465e38 Announcing the LangChain + MongoDB Partnership: The AI Agent Stack That Runs On The Database You Already Trust AIアプリケーション開発で広く使われる「LangChain」と、クラウドデータベースの「MongoDB」が戦略的パートナーシップを発表しました。この提携は、AIエージェントをプロトタイプ(試作)からプロダクション(本番運用)へとスムーズに移行させるための「AIエージェント・スタック」を提供することを目的としています。 背景:本番環境におけるエージェント開発の課題 AIエージェントを実際のビジネス現場で動かすには、単にモデルに指示を出すだけでは不十分です。 クラッシュしても続きから再開できる「永続的なメモリ(記憶)」企業の膨大なデータから必要な情報を探す「検索機能(RAG)」データベース内の構造化データへのアクセス何が起きたかを分析できる「デバッグや監視の仕組み」 これらを実現するために、従来は複数の異なるシステムを組み合わせて同期させる必要があり、インフラが非常に複雑になるという課題がありました。 今回の統合が提供する主な機能 今回の提携により、MongoDB AtlasをAIエージェントの包括的なバックエンドとして利用できるようになります。 Atlas Vector Searchの統合: ベクトル検索がLangChainにネイティブ対応しました。運用データと同じ場所でベクトル検索ができるため、データの同期の手間が省け、セキュリティ管理も一本化できます。...
    Más Menos
    Menos de 1 minuto
  • 株式会社ずんだもん技術室AI放送局 podcast 20260331
    Mar 30 2026
    youtube版(スライド付き) 関連リンク 定常業務を自動操縦にする — Claude Code スケジューラーの育て方 本記事は、AIエンジニアリングツール「Claude Code」の新機能であるスケジューラーを活用し、日々のルーチンワークを自動化して「タスクを覚えておくストレス」を解消する運用ノウハウを解説したものです。特に、細かな事務作業に追われがちなエンジニアやマネージャーにとって、業務効率を劇的に改善するヒントが詰まっています。 スケジューラーの3つの実行環境 Claude Codeには、用途に応じた3つのスケジューラーが用意されています。 /loop: セッション内の一時的な自動化。デプロイ監視などに適しています。Desktop: 自分のPC上で実行。実行中にプロンプトの微調整ができるため、開発中のタスクに最適です。Cloud: Anthropicのクラウド上で実行。PCを閉じていても定時に実行されるため、安定したタスクの完全自動化に向いています。 なぜ強力なのか:MCPとの連携 最大の特徴は、MCP(Model Context Protocol)を通じて、Slack、Notion、GitHub、Google Calendarなどの外部ツールとノンコーディングで連携できる点です。従来のツールでは個別のAPI連携コードを書く必要がありましたが、Claude Codeなら「カレンダーから予定を取り、GitHubの活動をまとめてSlackに送る」といった横断的な処理を、自然言語のプロンプトだけで定義できます。 具体的な自動化の例 記事では、以下のような実用的なワークフローが紹介されています。 1on1準備: メンバーのGitHubやSlackの活動を自動収集し、面談用サマリーを作成。議事録生成: MTG後に内容を整形してNotionへ保存し、Slackへ要約を投稿。日次レポート: 前日のTODOと当日の予定を突き合わせ、報告書を自動作成。自動化提案: 自分の活動記録をAIが分析し、次に自動化すべき作業を提案。 成功の秘訣:「Desktopで育ててCloudに昇格」 いきなり完全自動化(Cloud)を目指すと、予期せぬエラーや低品質な出力が発生しやすくなります。まずはDesktopスケジューラーで実際に動く様子を確認しながらプロンプトを微調整し、3回以上連続で期待通りの結果が出せるようになってからCloudへ移行するという、段階的な「育成」アプローチが推奨されています。 まとめ 自動化の目的は、単なる時短ではなく「本来集中すべき重要な仕事にリソースを割くこと」にあります。まずは1つの定常作業をAIに任せることから始め、徐々に「自分専用の自動操縦システム」を構築していくことで、エンジニアとしての生産性を一段上のステージへ引き上げることができます。 引用元: https://zenn.dev/dely_jp/articles/cf19634b63015b OpenClaw × OllamaをMacBook 16GBで動かす - ローカルLLM入門 本記事は、MacBook(メモリ16GB)という一般的な開発環境で、ローカルLLMランタイム「Ollama」とAIエージェントフレームワーク「OpenClaw」を組み合わせ、自分専用のローカルAIアシスタントを構築する手法を解説したものです。 1. 概要と構成要素 OpenClaw: TypeScript製のマルチチャネルAIエージェントフレームワークです。SlackやDiscordなど20以上のプラットフォームに対応し、Ollamaをネイティブサポートしています。単なるチャットではなく、自律的にツールを使いこなす「エージェント」としての動作に特化しています。Ollama: llama.cppをベースとしたGo製のローカルLLMランタイムです。モデルの管理(Pull/Run)が容易で、Apple Siliconの統合メモリを効率的に活用できます。推奨モデル: 日本語対応が良好で、エージェント動作に必須なツール呼び出し機能(Tool Calling)を備えた「Qwen3:8b」などが挙げられています。 2. ローカルLLM導入のメリットと課題 メリット: クラウドLLMと異なり従量課金が発生せず、実質ゼロコストで利用できます。また、データが外部サーバーに送信されないため、機密情報を扱う際のプライバシーとセキュリティが完全に確保されます。課題(制約): パフォーマンスはハードウェアに強く依存します。16GBメモリのMacBook(CPU推論)では、8B程度のモデルでも1応答に約1分かかる場合があり、クラウドAPIと比較すると大幅なレイテンシが発生します。 3. ハイブリッド戦略の提案 実用性を高める手法として「ハイブリッド...
    Más Menos
    Menos de 1 minuto
Todavía no hay opiniones