スキル群
プラグインは Claude Code の スキル(SKILL.md で定義する手順書)を 5 つ同梱します。 中核は記憶を扱う 3 つ(recall / remember / memory-gc)で、加えて別 LLM へ作業を逃がす 2 つ(ask-local / codex-review)があります。
スキルは「エージェントへの手順書」であり、実際の処理はすべて memory_system の CLI が行います。スキル自身は LLM 非依存のツールを呼ぶだけで、知的判断(どれを統合するか等)をセッション内に残すのが共通の設計です。
recall — 記憶の想起
過去の決定・文脈を取り戻すスキル。ローカル FTS5 のみ=追加課金ゼロ。
発動条件:作業を始める前、ユーザーが過去の話題・決定に言及したとき(「前にどう決めた?」「覚えてる?」)、セッションをまたいで文脈が欠けていると感じたとき。
手順の要点:
index_memory.py search "クエリ" -n 5 --jsonで検索する。日本語は 3 文字以上が高精度(2 文字でも部分一致で動く)。- 各ヒットの
dateを確認し、古い記憶は現状と食い違う可能性を前提に扱う。矛盾を見つけたら remember で更新する。 - 0 件なら言い換えて 1 回だけ再検索(例:「認証」→「ログイン」)。
- それでも記憶に無ければ、transcript(生ログ)を直接 grep する。
grep -rliF --include='*.jsonl' -- "キーワード" ~/.claude/projects/ | head -5ヒットした sessionId は claude --resume <sessionId> で再開できる、という案内まで含むのが特徴です。「記憶 md に無い過去」も transcript まで掘りに行く二段構えになっています。
remember — 記憶の保存
恒久的に残すべき事実を記憶 md に保存するスキル。書き込みは必ず CLI 経由(md を直接編集しない)。これは memory_write.py が重複拒否・字数上限・日付規約を機械的に強制するためです。
何を残す / 残さないか:
| 残す | 残さない |
|---|---|
| 設計・方針の決定とその理由 | 一時的な作業状態(→ CONTEXT.md へ) |
| ユーザーの好み・作業スタイル | コードや git 履歴から分かること |
| 恒久的な事実・制約・環境情報 | 秘密情報(トークン・パスワード等)絶対禁止 |
手順の要点:
- 必ず先に検索する(重複防止の要)。既存ブロックが同じテーマを扱っていたら、新規追加せず
replaceで更新する。矛盾する場合もreplace(古い記述を残さない)。 - 新規なら
append、既存更新ならreplace。見出しは絶対日付(YYYY-MM-DD)必須。 - 拒否されたら従う(error-driven consolidation)。「同一内容が既に存在」なら保存不要。「上限超過」なら提示されたブロック一覧から統合してから保存し直す。上限を理由に保存を諦めない。
「1 事実 = 1 ブロック」「保存したらユーザーに一言触れる(透明性)」といった運用ルールも定義されています。
memory-gc — 記憶の棚卸し
溜まった記憶の重複・陳腐化を整理し、検索品質を保つスキル。候補列挙はローカルツール(課金ゼロ)、統合の判断と実行だけをセッション内で行う。
発動条件:ユーザーが「記憶を整理して」と言ったとき、remember がファイル上限で拒否したとき、月 1 回程度の定期メンテ。
手順の要点:
memory_report.py --stale-days 90でレポート取得(詳細)。- カテゴリごとに対応する。
| カテゴリ | 対応 |
|---|---|
| 重複候補ペア | 内容を読み比べ、新しい方に統合して古い方を消す |
| stale(90 日以上未更新) | まだ正しい→そのまま / 変わった→replace / 不要→削除 |
| 肥大ファイル | テーマ別に分割するか、ブロックを統合して圧縮 |
- 原則:削除より統合を優先(情報を失わずに圧縮)。迷ったら削除せずユーザーに確認。
- 最後に
index_memory.py reindexで再索引し、件数を報告。
ask-local — ローカル LLM へ逃がす
軽い・安い・プライバシー重視のタスクを ローカルの無料 LLM(Ollama) に投げるスキル。コスト 0・データを外部 API に出さない。
- 前提:
ollama serveが127.0.0.1:11434で稼働。既定モデルはqwen3:14b。 - 用途:要約・分類・下書き・大量反復など、最高品質が不要なバッチ処理。機密データを Claude/Codex に出したくないとき。
- 実装上の注意:qwen3 は
"think": falseを付けないと延々と推論して終わらないため、API 呼び出しで明示的に thinking を切る。
curl -s http://127.0.0.1:11434/api/generate \
-d '{"model":"qwen3:14b","prompt":"<タスク>","think":false,"stream":false}' \
| python3 -c "import sys,json;print(json.load(sys.stdin)['response'])"codex-review — 別エンジンのセカンドオピニオン
OpenAI Codex CLI を「別の頭脳のレビュアー」として呼ぶスキル。Claude とは違う視点が欲しいとき、画像(スクショ)レビューをしたいときに使う。
- 前提:
codexが PATH にありcodex login済み。コストは ChatGPT アカウントの枠を消費する(サブスクとは別財布)ため乱用しない。 - レビューは書き換え不要なので必ず
--sandbox read-onlyを付ける。
git diff | codex exec --sandbox read-only "このdiffをレビュー。バグ・設計・改善点を重要度順に簡潔に。"Codex は vision 対応なので UI スクショの見た目/UX レビューも可能です。
NOTE
ask-local(無料・ローカル)と codex-review(有料・別エンジン)は、コストと品質のトレードオフで使い分ける設計です。 「無料で済む軽い処理は ask-local、質・別視点・画像が要るときは codex-review、最重要な判断は Claude 本体」という三層の役割分担が SKILL.md に明記されています。