# Project Spec & Rules

## 代码规范

### Google风格代码
详细参阅：https://raw.githubusercontent.com/shendeguize/GooglePythonStyleGuideCN/refs/heads/master/README.md

### 代码编写原则
- 简洁，清晰易懂，最小化实现
- 条件或循环分支不能超过三层，提前Return以减少分支的出现
- 变量说明注释、条件或循环分支注释完全
- 无需向后兼容，避免添加过多功能
- 先编写测试集，再实现代码
- 实现测试集后，先询问用户意见，用户确认后才能继续
- 如非用户要求，无需编写基准测试代码
- 英文注释，中文文档
- 完成代码编写后，在文档的框架不变的情况下更新文档，如CLAUDE.md

### 测试编写原则
- 精简、干净、快速
- 核心关键逻辑或算法必须测试
- 需要加载transformer模型进行验证的测试与无需加载模型的测试分离
- 无需编写测试集的情况
  - UI界面相关的代码
  - 过于复杂或耗时的逻辑
  - 基准测试相关

### 关键词说明
- 确认：用户认同当前的实现方案或测试集实现，即可以开始工作
- 继续：用户需要你重读上下文，继续未完成的工作

### 文档更新说明
仅在工程目录变化时，更新此文档的目录说明部分。
如需修改其他部分，请先询问，在进行修改。

## 工程说明
使用UV管理整个工程，pytest用于测试，justfile用于快捷命令，jujutsu用于版本管理。

### 目录说明

**核心模块**
- mini-nav/main.py — CLI 入口 (Typer)
- mini-nav/database.py — LanceDB 单例管理，用于向量存储与检索
- mini-nav/feature_retrieval.py — DINOv2 图像特征提取与检索

**源代码目录 (mini-nav/)**
- mini-nav/configs/ — 配置管理 (Pydantic + YAML)
- mini-nav/commands/ — CLI 命令 (train, benchmark, visualize, generate)
- mini-nav/compressors/ — 特征压缩算法
  - hash_compressor.py — 哈希压缩器与训练loss
  - pipeline.py — 压缩流水线（整合 DINO 特征提取）
  - train.py — 压缩器训练脚本
- mini-nav/data_loading/ — 数据加载与合成
  - loader.py — 数据加载器
  - synthesizer.py — 场景合成器
- mini-nav/utils/ — 工具函数
  - feature_extractor.py — 特征提取工具
- mini-nav/tests/ — pytest 测试集
- mini-nav/benchmarks/ — 基准测试 (recall@k)
- mini-nav/visualizer/ — Dash + Plotly 可视化应用

**数据目录**
- datasets/ — 数据集目录
- outputs/ — 默认输出目录 (数据库、模型权重等)

### Python库
详细可查询pyproject.toml或使用`uv pip list`获取详细的库信息，请基于目前的库实现功能。
如需添加新库，请先询问，用户确认后才能使用`uv add <package>`新增库。

## 版本管理 (Jujutsu 特有)
本项目使用 Jujutsu (jj) 进行版本控制，并配套 Memorix MCP 作为架构决策与思维轨迹的持久化中心。

- 技能调用: 必须使用 jujutsu 相关工具技能来执行分支、提交、修改（describe）等操作，禁止直接通过 Shell 执行冗长的 Git 兼容指令。
- 描述规范 (jj desc):
  - 执行 jj desc 时，首行必须是精简的变更标题。
  - 空一行后，仅记录改动的核心业务点。
  - 语言使用英文进行描述
  - 禁忌: 禁止在 jj 描述中堆砌复杂的算法逻辑或长篇的设计决策。
- 记忆联动 (Memorix 优先):
  - 凡涉及架构变更、算法决策或重构逻辑，在执行 jj desc 之前，必须先调用 memorix_store (或对应的添加方法)。
  - 关联标记: 在 Memorix 的存储记录中，必须强制包含当前变更的 jj change ID，以便实现从代码变更到思维链的完美映射。
  - 检索逻辑: 在处理需要深入理解上下文的任务时，应主动调用 memorix_search 检索相关的历史 change_id 决策。
- 无感记录原则:
  - 严禁在工程目录下生成任何独立的 change_log.md 或 AI 自动化文档。
  - 所有关于“为什么这样改”的知识，应当流向 jj 的原子化提交描述或 Memorix 的知识图谱库。

### 描述示例
```text
refactor(compressors): Simplify module by removing SAM/DINO separation code

- Remove dino_compressor.py and segament_compressor.py
- Rewrite pipeline.py to inline DINO into HashPipeline
- Maintain backward compatibility: SAMHashPipeline alias
- Update tests and benchmark.py
```

### 提交步骤
- 执行`jj diff --no-pager`获取当前所有更改
- 根据更改内容，与openspec生成的相关文档进行总结，重点在于更改内容及其决策逻辑
- 调用记忆功能，如Memorix记忆先前总结的内容
- 遵循描述规范，使用jj进行更改的描述
- 执行`jj new`开启一个新的更改

## 记忆管理 (Memorix MCP)
本项目使用 Memorix 作为核心上下文引擎，用于存储架构决策、复杂逻辑关联和历史重构原因。

### 记忆写入准则
- 主动记录: 在完成以下操作后，必须调用 `memorix.store`：
  - 用户确认后的核心架构变更（例如：LanceDB 的索引策略）。
  - 复杂的 bug 修复逻辑（记录“为什么”这么修，防止回滚）。
  - 用户在对话中表达的明确偏好（例如：对特定 Python 库的厌恶）。
  - 代码的修改及其决策逻辑(例如：对于用户特定需求导致的更改)。
- 结构化存储: 存储时请使用 `[Category: Topic] Description` 的格式，确保检索效率。

### 记忆检索准则
- 冷启动检索: 每一轮新对话开始或切换到新任务时，优先调用 `memorix.search` 关键词（如 "project_architecture", "database_schema"），以确保不偏离既有设计。
- 防止幻觉: 如果对某个旧功能的实现细节不确定，先检索记忆，禁止凭空猜测。

### 内存与冗余控制
- 精简描述: 存入 Memorix 的信息必须精简，严禁存入整段代码块，仅存储“逻辑描述”和“决策依据”。
- 清理逻辑: 发现记忆库中存在与当前代码事实冲突的旧信息时，应主动提示用户进行更新或覆盖。