LLM Wikiとは？：Karpathyが提唱した「自分専用AI知識基地」のすべてを知りたい

著者： ゆいまる‐IT界隈以外でAIを使いまくる2005年生まれ

概要

LLM Wiki（またはLLM知識ベース）は、AI研究の第一人者であるAndrej Karpathy氏が2026年4月にGitHub Gistで公開した知識管理のパターンです。

従来のRAG（Retrieval-Augmented Generation）のように、毎回質問時に生の資料から情報を探して即興で答えるのではなく、LLM（大規模言語モデル）が「永続的なWiki」を自動的に構築・維持するというアイデアです。

具体的には、ユーザーが集めた生の資料（論文、記事、メモ、音声書き起こしなど）を「raw sources」フォルダに置き、LLMがこれを読み込んでMarkdown形式のWikiページ群を作成します。

三層構造

要約ページ、人物ページ、概念ページ、比較ページ、全体合成ページなどが相互にリンクされ、知識がどんどん豊かになっていく仕組みです。三層構造が特徴：

変更不可の生資料
LLMが完全に所有するWiki層
LLMへの指示書（schema、例：CLAUDE.md）

人間は資料の選定や方向づけだけを担当し、LLMがまとめ・更新・つなぎ合わせの面倒な作業を全部引き受けてくれます。

ObsidianなどのMarkdownビューアと組み合わせれば、グラフビューで知識のつながりを視覚的に確認しながら使える、まさに「自分専用の小さなWikipedia」が育つイメージです。

個人研究、読書ノート、ビジネスチームの社内Wiki、競合分析など幅広い用途で注目されており、公開直後から世界中で議論を呼び、日本でもClaude CodeやObsidianとの組み合わせ事例が急速に広がっています。

性能

知識の複利成長

LLM Wikiの最大の強みは「知識の複利成長」です。従来RAGでは、質問ごとにLLMが資料の断片を検索・再構築するため、規模が大きくなると合成の精度が落ちやすく、毎回同じ労力を繰り返します。

一方、LLM Wikiでは1回資料を「コンパイル」すると、以後その知識がWikiとして固定化・更新され続けます。クロスリファレンス（相互参照）はすでに張られ、矛盾点はフラグ付けされ、全体の合成は常に最新状態です。

中規模（約100資料、数100ページ程度）まではindex.mdという目次ファイルだけで十分にナビゲーション可能で、重いベクトル検索インフラを必要としません。

実装の効率性

LLMが1回のインジェスト（資料投入）で10〜15ページを更新するような作業も、最新のClaude Codeなどのエージェントなら高速にこなせます。実際のユーザー報告では、40万語規模の知識ベースをほぼ人間が一文字も打たずに構築できた事例も出ており、保守コストが極めて低いのが実感されています。

さらにLint（健全性チェック）機能で定期的に矛盾や古い記述を自動検知し、不足部分を提案してくれるため、Wikiは「放置しても腐らない」状態を保てます。出力はすべてプレーンテキストのMarkdownなので、Gitでバージョン管理でき、ObsidianのグラフビューやDataviewプラグインとも相性抜群です。

ローカル完結でプライバシーを守りつつ、必要に応じてCLI検索ツール（qmdなど）を追加して大規模化も可能です。

LLM Wikiと類似ツールの比較

LLM Wiki（Karpathy方式）は、Markdownベースの永続的知識コンパイルアプローチとして注目されています。以下に、主な類似ツールやアプローチとの違いを整理します。

1. 伝統的RAG（Retrieval-Augmented Generation）

仕組み: 生資料をチャンク分割・ベクトル埋め込みし、クエリ時に類似検索で関連部分を引っ張ってLLMに渡す。毎回即興で回答生成。

LLM Wikiとの違い: RAGはステートレス（状態を持たない）で、知識が蓄積・洗練されません。一方、LLM Wikiはインジェスト時にLLMがWikiページを積極的に作成・更新・リンクし、知識が「コンパイル」されて複利成長します。

2. Obsidian（単独） + 手動Zettelkasten

仕組み: ローカルMarkdownノートアプリ。双方向リンクとグラフビューで知識を繋ぐ。プラグイン（Dataviewなど）で拡張。

LLM Wikiとの違い: Obsidianは人間が主に作成・メンテナンスします。LLM WikiはLLMが自動で要約・更新・リンク・矛盾解決を担います。Karpathy方式はObsidianを「フロントエンド」として推奨しており、相性抜群です。

3. Notion / Notion AI

仕組み: クラウドベースのオールインワンワークスペース。データベース・Wiki・AI自動生成機能。

4. Logseq / Roam Research（アウトライナー型）

仕組み: ブロックベースの双方向リンクノート。クエリ機能で動的集約。

5. 専用AI知識ツール（Dume Cowork、Mem、Read AIなど）

仕組み: LLMを活用した自動整理・検索ツール。PDF対応やノーコードUIを売りにするものが多い。

6. その他のオープンソース/拡張（LlamaIndex、Fabric、qmdなど）

LlamaIndexなどはRAGフレームワークで、LLM Wikiの補完として使えます。qmdなどはMarkdown検索ツールで、LLM Wikiの大規模化に有効です。

どんな悩みを解決するか

多くの人が抱える「知識の墓場問題」を根本的に解決します。資料を溜め込んでも、散らばったまま検索しにくく、つながりがわからない、時間が経つと内容を忘れる——そんなフラストレーションです。

LLM Wikiはこれを逆転させます。LLMが「疲れない司書」となって、資料を読み込み、要約し、既存ページを更新し、矛盾を指摘し、関連を自動リンクします。

要するに、AIを「一時的な検索ツール」から「永続的な知識パートナー」に変えることで、情報過多時代の本質的な悩みを解消してくれるのです。

活用方法

セットアップ

導入は簡単。基本はフォルダ構成だけ準備すればOK。以下の3つを用意し、Obsidianで全体を開きます：

raw/（生資料）
wiki/（生成されたWiki）
schema/（LLM指示書）

schemaファイルには「インジェスト時のルール」「ページの命名規則」「矛盾時の扱い方」などを詳細に書いておき、LLMと一緒に進化させていきます。

ワークフロー（3つの操作）

1. Ingest（投入）

新しい資料をraw/に入れ、LLM（Claude Codeや類似エージェント）に「この資料を処理して」と指示します。LLMが要約を作成し、関連ページを更新し、index.mdとlog.mdをメンテナンスします。1件ずつ丁寧に確認しながら進めるもよし、まとめてバッチ処理するもよし。

英語での運用について：英語がいいらしいので、著者は翻訳しておくようにしているとのこと。

2. Query（質問）

Wikiに対して質問すると、LLMがindex.mdを参照して関連ページを読み、引用付きで回答します。良い回答は「新しいWikiページ」として保存して蓄積します。

3. Lint（点検）

定期的に「Wikiの健康診断」を依頼します。矛盾、古い情報、孤立ページ、不足概念を指摘してもらい、次のアクションを提案してもらいます。

実践ツール

Claude Code + Obsidianの組み合わせ

人気なのはClaude Code＋Obsidianの組み合わせです：

Obsidian Web Clipper：Web記事をMarkdown化して即投入
画像保存：画像もローカル保存してLLMが参照可能に
Dataviewプラグイン：動的にページを集約・可視化

自動化

オープンソースのCLIツール（例：llm-wiki-compilerなど）を使えば、コマンド1発でインジェストからコンパイルまで自動化も可能です。Git連携すれば変更履歴も完璧に残せます。

初心者ならまずは小規模（10資料程度）から始め、schemaをLLMと共同編集しながらカスタマイズしていくのがおすすめです。

Karpathyの他の主なAI提唱・コンセプト

（Software 1.0/2.0/3.0、Vibe Coding、AutoResearch 等の解説が続く。llm-wiki 本題からは離れるため要約のみ）

Software 3.0（2025年YC AI Startup School の keynote「Software Is Changing (Again)」）: プロンプト（自然言語、特に英語）がプログラムになる。LLM が新しい「コンピュータ」。

AutoResearch / The Karpathy Loop（2026年3月頃）: AIエージェントが自律的に研究・実験をループさせる仕組み。nanochat で 2日間約700実験 → 20件の有効改善、Time-to-GPT-2 2.02時間 → 1.80時間（11%高速化）。Shopify CEO 事例: 1晩で37実験 → 19%性能向上。

著者の感想

著者は以下のようにコメントしています：

「これ使ってから、かなり知識の選定がしやすくなった。渡す知識がゴミすぎるとやっぱり出てくる結果もしょうもない。ガベージいん、ガベージあうと。」

つまり、LLM Wikiの品質は投入する生資料の品質に大きく依存するということです。良い資料を厳選して投入することが、より良いWikiの構築につながります。

参考リンク

公式のGistはKarpathy氏のGitHub Gistで公開されています： https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f

また、スキル定義ファイルについては以下も参照： https://github.com/forrestchang/andrej-karpathy-skills

llm-wiki

エクスプローラー

LLM Wikiとは？：Karpathyが提唱した「自分専用AI知識基地」のすべてを知りたい

LLM Wikiとは？：Karpathyが提唱した「自分専用AI知識基地」のすべてを知りたい

概要

三層構造

性能

知識の複利成長

実装の効率性

LLM Wikiと類似ツールの比較

1. 伝統的RAG（Retrieval-Augmented Generation）

2. Obsidian（単独） + 手動Zettelkasten

3. Notion / Notion AI

4. Logseq / Roam Research（アウトライナー型）

5. 専用AI知識ツール（Dume Cowork、Mem、Read AIなど）

6. その他のオープンソース/拡張（LlamaIndex、Fabric、qmdなど）

どんな悩みを解決するか

活用方法

セットアップ

ワークフロー（3つの操作）

1. Ingest（投入）

2. Query（質問）

3. Lint（点検）

実践ツール

Claude Code + Obsidianの組み合わせ

自動化

Karpathyの他の主なAI提唱・コンセプト

著者の感想

参考リンク

グラフビュー

目次