
Atsushi Nakatsugawa
June 23, 2026
1 min read
Build an AI second brain for engineering teamsの意訳です。
シニアエンジニアは、なぜ決済サービスが諦める前に3回リトライするのか、なぜ金曜の午後4時以降は特定のモジュールに触らないのか、どの「明確な」リファクタリングが、誰も依存関係を覚えていない下流サービスをサイレントに壊すのかを知っています。こうしたことが文書化されていなければ、その人が離れた瞬間に知識も一緒に失われます。
この文書化されていない記憶こそが、エンジニアリング組織にとって本当のセカンドブレインです。エンジニアリングチーム向けのAIセカンドブレインは、コードベースに関する意思決定、レビュー履歴、チームの標準を記録し、レビュアーが変更を評価するときに自動で適用します。そのため、担当者がいなくなっても知識は残ります。AI支援開発によって、この問題は差し迫ったものになっています。Stack Overflowの2025年開発者調査では、84%の開発者がAIツールを使用している、または使用予定である一方、AIの出力が正確だと信頼しているのは33%にとどまりました。
エンジニアリングチーム向けのセカンドブレインは、レビュー中にコードベースの記憶を適用します。コードベースがどのように動いているかを記録し、変更が発生するワークフローにその知識を持ち込みます。チームが知っていることの大半は、ドキュメントには残っていません。
組織の暗黙知は個々の従業員の頭の中に存在していることが多く、退職や異動によって、その集中は運用上のリスクに変わります。少数の人が「本当はどう動いているか」を覚えていることにシステムが依存するほど、その人たちが離れたときに組織は脆くなります。
多くのチームでは、失われる知識にはデプロイ手順、アーキテクチャ上の意思決定、意思決定理由が含まれます。特に最後の点は高くつきます。6か月後に誰かが何かを変更しようとしても、なぜチームがその形で作ったのか誰も覚えておらず、過去の失敗を繰り返すか、古い意思決定を理由も分からないまま踏襲することになります。
バス係数はこのリスクを過小評価します。ビルケント大学とJetBrains ResearchによるBus Factor In Practiceの研究では、バージョン管理データからバス係数を推定するツールは、ほとんどコードを書かないシニアエンジニアを見落とす可能性があると示されています。そうしたエンジニアは、議論やコードレビューを通じて知識を伝えています。知識が最も集中している人たちこそ、コミット履歴のダッシュボードでは見えないのです。
同じミスが3スプリント連続でレビューを通過するなら、それは測定可能なコストを伴う知識喪失の問題です。
レビュー品質はコンテキストに左右されます。165人のマネージャーと873人のプログラマーを対象にした研究では、コンテキストと変更内容の理解がレビュー時の直接的な課題であり、レビューコメントの品質に影響することが示されました。作者がコンテキストと方向性を提供すると、レビュアーはより良く、より速く対応しました。それがない場合、レビュー品質は低下しました。
2025年のNASAの研究では、あるエンジニアの言葉が引用されています。
「入社したときにはシニアがいましたが、その後すぐに離れました。だから経験のない自分だけが残され、多くの知識が一瞬で消えてしまったので大変でした」
コードレビューは、その知識を人から人へ受け渡す役割も大きく担っています。不具合を見つけるだけでなく、レビューは知識移転、チーム内の状況共有、別のアプローチの提示をもたらします。シニアレビュアーが離れると、不具合を見つける人と、教える仕組みの両方を同時に失います。
AIによるコード作成は、構造的な弱点を日々の運用上の圧力に変えました。現在、リポジトリ内のコードの42%はAI支援で書かれており、The New Stackは2027年までに65%に達すると予測しています。
CodeRabbitは、開発者がすでに作業している場所でそのレビュー層を提供します。そのため、AIが書いた追加のコードも、本番環境へ反映される前に人間の判断を通過します。
CodeRabbitのState of AIレポートは470件のPRをレビューし、AIが共同作成したプルリクエストでは平均10.83件の指摘があったのに対し、人間だけが作成したPRでは6.45件で、1.7倍の増加だったとしています。90パーセンタイルでは、AI PRの指摘は26件、人間のPRでは12.3件でした。これにより、最悪のPRほどレビュアーの注意を大きく消費する、裾の重いレビュー作業が生まれます。

DevOps Research and Assessmentグループの2025年レポートは、この結果を検証コストと呼びました。書く時間を短縮しても、レビュー、テスト、マージ前チェック、リリースシステムが新しい量に追いついていなければ、その時間は監査に再投入されます。freeeでは、AIコーディングエージェントを使うエンジニアが、人間のレビュアーが処理しきれないほど多くのPRを作成していました。CodeRabbitを通じてレビューを回すことで、同チームは6か月で32.8週分のレビュアー時間を削減しています。
レビューキューに流れ込むAI生成コードを適切にレビューするには、コンテキストが必要です。レビュアーは、それをローカルなビジネスロジック、規約、過去の意思決定と照らし合わせて確認しなければなりません。同じレビューでは、アルゴリズムとビジネスロジックのエラーがAI PRで2倍以上発生していたことも分かりました。これは根本原因を示しています。AIは、ビジネスロジック、規約、過去の意思決定に関する十分なコンテキストなしにコードを生成するのです。
チームはたいてい、まずドキュメントに頼ります。しかし、その対策はWikiが存在してきた期間と同じくらい長く失敗し続けてきました。
ドキュメントは、最新状態を保つために必要な作業がコードベースの変更ペースに追いつけないと劣化します。JetBrainsのドキュメント批評は、この構造的な不一致をはっきり指摘しています。多くのソフトウェアチームがシステムを変更する速度に対して、ドキュメントを最新に保つ労力が見合わないため、ドキュメントは最初に一度書かれ、その後ずれていきます。
同じ問題はナレッジシステムにも現れます。職場のWikiは、生きたナレッジマネジメントシステムではなく、静的な文書のままであることがよくあります。シニアエンジニアは経験からその隙間を埋められますが、AIエージェントは古いコンテキストや欠けたコンテキストを同じように補えるとは限りません。
知識は、行動の瞬間に提示される必要があります。ドキュメントは誰かが読むことを思い出したときにしか機能しませんが、レビュー時の記憶は標準をPRそのものに持ち込みます。
AIコードレビューは、この問題の形を変えます。CodeRabbit Learningsはレビュアーチャットからフィードバックを記録し、将来のレビューに自動で適用します。設計上の選択に対する1回の修正を、次のPRが引き継ぐ標準へ変えるのです。
新入社員の3週目を想像してみてください。きれいなPRを出したのに、どこにも書かれていない規約を理由にレビュアーから差し戻されます。どうやって知ればよかったのでしょうか。
ソフトウェアに特化した有用なオンボーディングのマイルストーンは、新入社員が10件目のPRを出すまでの時間です。より深いギャップは、最初の貢献の後にあります。それは、コードを提出することと、コードベースの書かれていないルールに習熟することの距離です。
暗黙知は、決まって新入社員をつまずかせます。人によって同じプロセスの説明が異なり、善意の同僚も、自分にとって当たり前になった手順を忘れてしまいます。チームが最も深く内面化している規約ほど、チームメイトが口に出して説明する可能性は低くなります。そのため、新入社員はレビューでそれを破って初めて学ぶことになります。
レビューが標準を適用すれば、新入社員は誰かが記憶を頼りに教えてくれるのを待つのではなく、自分のPRへのコメントからその標準を受け取れます。
重要なセカンドブレインは、チームの意思決定を記憶し、新しいコードをそれらに照らして確認します。コードを書くツールはすでにあります。チームに必要なのは、検証にコンテキストを持ち込むレビュー層です。
有用なセカンドブレインには、単なる機能名以上のものが必要です。CodeRabbitのコンテキストエンジンは、コードグラフ解析を通じてコードベースをインデックス化し、そこに関連チケットや過去のPR、チームの意思決定を重ねて、そのコンテキストからレビューコメントを生成します。差分しか見ないレビュアーは、ローカルな変更を危険にする呼び出し元、依存関係、サービスレベルの影響を見落とすことがあります。コードベースのコンテキストを持つレビュアーなら、変更が本番環境へ反映される前にそれらの関係をたどれます。

コーディングループがより自律的になると、その検証ステップが重要になります。Mastraのエンジニアリングチームは、1.0リリースを前に、一貫しないレビューと信頼できないAIレビューツールに直面していました。CodeRabbitを導入した後、同チームはマージ前の重大コメントの受け入れ率を70%から85%まで高めました。CodeRabbitのMastra事例で、CTOのAbhi Aiyer氏は一貫性の必要性を強調し、「一貫性が50%のツールは使えません」と述べています。この適用は、インデックス化されたコンテキストと保存された意思決定をマージ前に適用することで実現されます。
「Learnings」や「memory」をうたう製品でも、適用可能で長く使えるコンテキストが必要です。信頼する前に、どのようにコンテキストを記録するのか、どのように提示するのか、コードベースが大きくなってもシグナルが保たれるのかを確認しましょう。
コミット履歴だけに基づいてインデックス化されたメモリ機能には、コミットベースのバス係数計算と同じ死角があります。知識がコミットではなく議論に存在するシニアレビュアーを見落とします。システムがレビュー履歴、関連チケット、チームの意思決定、ファイル横断の依存関係をインデックス化するのか、それとも差分だけを見るのかを確認してください。ここではグラフベースの検索が重要です。コード生成ベンチマークでは、グラフ誘導検索が埋め込みベースの検索を上回り、グラフ推論コンポーネントを取り除くと精度が6ポイント以上低下しました。レビュー用メモリでも同じシグナルを確認する価値があります。
コンテキストウィンドウを大きくするだけでは解決しません。適切なコンテキストは、無制限に広げるのではなく、キュレーションされた形でレビューの瞬間に現れる必要があります。すべてを保持できるウィンドウでも、この変更を危険にする過去の意思決定を埋もれさせてしまうことがあります。
誤検出はアラート疲れを生みます。レビュアーが価値の低いコメントに多く遭遇すると、次第に気に留めなくなり、無視するようになります。RAGAS評価フレームワークはノイズ感度を明示的な指標として扱っており、これはレビュー用メモリシステムにとって正しい発想です。キューを大量の指摘で埋めるセカンドブレインは、新しいボトルネックになります。
設定可能なシグナル感度を使いましょう。パスや抽象構文木(AST)に基づく指示、コーディングガイドライン、Learnings、LinterやSASTツール、リポジトリ固有のガードレールによって、レビューで何を提示し、何には触れないかを調整する必要があります。チームがAIでコードを書くときに使う同じ.cursorrulesや.copilot-instructionsファイルが、すべてのPRレビューにも適用されれば、標準がずれていく問題は小さくなります。
シニアエンジニアは、ずっとチームのセカンドブレインを頭の中に抱えてきました。その知識は移転しにくく、永続的でもなく、「なぜチームはこの形で作ったのか」という答えと一緒に失われていました。AIによるコード作成は、コンテキストを必要とするコードをレビューキューに大量に流し込み、最も豊富なコンテキストを持つ人たちが過負荷になっているまさにその瞬間に、このギャップを緊急課題にしました。
CodeRabbitにとってコンテキストエンジニアリングとは、コードベース、関連チケット、過去のPR、チームの意思決定からレビューコンテキストを構築し、PRレビュー中にそのコンテキストを適用することです。CodeRabbitのエージェント型レビューは、コードベースのコンテキストを適用し、すべてのPRで標準を徹底し、過去のPRやチャット由来のLearningsを活用して、その後のレビューに反映します。開発者はこれまで通りコードをリリースできます。レビュープロセスは、意思決定を利用可能な状態に保ちます。
GitHubとGitLabで最もインストールされているAIアプリにより、コードレビュー時間とバグを50%削減しましょう。CodeRabbitの14日間の無料トライアルを始めてください。