株式会社ずんだもん技術室AI放送局 podcast 20250619 Podcast Por  arte de portada

株式会社ずんだもん技術室AI放送局 podcast 20250619

株式会社ずんだもん技術室AI放送局 podcast 20250619

Escúchala gratis

Ver detalles del espectáculo

Acerca de esta escucha

関連リンク 【Claude Code Tips】私のマイCLAUDE.mdを解説します この記事では、ターミナルで動作するAIコーディングツール「Claude Code」をより効果的に使うための設定ファイル「CLAUDE.md」について、具体的な設定例を交えながら解説されています。新人エンジニアの方も、AIを活用した開発のヒントとして役立つでしょう。 CLAUDE.mdは、Claude Codeにプロジェクト固有の知識を覚えさせる「メモリ機能」です。これにプロジェクトの設計やコーディングルール、作業の流れなどを記述することで、AIが生成するコードの質を上げることができます。たくさん書きすぎるとAIが内容を無視してしまうことがあるため、必要な情報を簡潔にまとめることが大切です。英語で書く方がAIが処理しやすい(トークン量を抑えられる)側面もありますが、筆者は保守性を考慮して日本語で書くことも問題ないとしています。 筆者のCLAUDE.mdには、開発中のSNSアプリ「Gotoshisha」の具体的な情報が記述されています。 プロジェクト概要: アプリの目的や主な機能。技術スタック: 利用しているプログラミング言語、フレームワーク、クラウドサービスなど。プロジェクト構造: ディレクトリの構成。開発ワークフロー: 環境構築や開発開始の手順。テストガイドラインとコード生成規約: テストの書き方(Vitestを使い、テストコードを実装ファイルと同じ場所に書く、日本語でテスト説明を書くなど)や、コードの書き方のルール(コメントの付け方、ハードコードを避けるなど)。 特に注目すべきは、テストガイドラインの重要性です。AIにコードを生成させる際、テスト駆動開発(先にテストを書き、それに合わせてコードを開発する手法)と組み合わせることで、AIが作ったコードが正しく動くかを確認しやすくなり、スムーズに開発を進められると筆者は強調しています。 また、Claude Codeが実行できるコマンドを細かく設定する.claude/settings.jsonファイルについても紹介されています。このファイルで、AIに自動で許可するコマンド(allowリスト)と、絶対に禁止するコマンド(denyリスト)を設定することで、安全にAIと協力して開発を進めることができます。 まとめると、CLAUDE.mdにプロジェクトの情報を詳しく、かつ簡潔に記述し、特にテスト駆動開発と組み合わせることで、Claude Codeの能力を最大限に引き出し、効率的で品質の高い開発ができるという点がこの記事の大きな学びです。 引用元: https://zenn.dev/dirtyman/articles/ddbec05fd9fbb4 Benchmarking LLM Inference Costs for Smarter Scaling and Deployment この記事は、大規模言語モデル(LLM)の運用にかかるコスト(推論コスト)を効率的に見積もり、賢くシステムを拡張・展開するための方法を、新人エンジニアにも分かりやすく解説しています。LLMが様々なアプリケーションの基盤となる中で、システムを大規模に運用する際には、どれくらいのインフラが必要で、総費用(TCO: Total Cost of Ownership)がどれくらいになるかを事前に把握することが非常に重要になります。 このブログ記事では、主に以下の3つのステップを通じて、LLMの推論コストを計算する流れを説明しています。 パフォーマンスベンチマークの実施: まず、LLMを動かすサーバーが、どれくらいの速さでどれだけの処理量(スループット)をこなせるのか、そして応答にどれくらいの時間(レイテンシ)がかかるのかを測定します。これは、必要なハードウェアの規模を決めるための土台となります。NVIDIAの「GenAI-Perf」のようなツールを使うと、「最初の単語が出るまでの時間(TTFT)」や「1秒あたりのリクエスト数(RPS)」といった主要な性能指標を測ることができます。これは、チャットボットのようにリアルタイム性が求められるシステムでは特に重要です。 ベンチマークデータの分析と最適な構成の特定: 測定したデータから、システムが最高の性能を発揮できるバランス点を見つけます。一般的に、多くのリクエストを同時に処理しようとするとスループットは上がりますが、個々の応答にかかる時間は長くなる傾向があります(レイテンシが増える)。このトレードオフを理解し、例えば「応答時間は250ミリ...
Todavía no hay opiniones