mirror of https://github.com/SikongJueluo/Mini-Nav.git synced 2026-03-10 11:27:49 +08:00

Files

refactor(compressors): Simplify module by removing SAM/DINO separation code

- Remove dino_compressor.py and segament_compressor.py
- Rewrite pipeline.py to inline DINO into HashPipeline
- Maintain backward compatibility: SAMHashPipeline alias
- Update tests and benchmark.py

2026-03-07 22:55:13 +08:00

5.9 KiB

Raw Permalink Blame History

Project Spec & Rules

代码规范

Google风格代码

详细参阅：https://raw.githubusercontent.com/shendeguize/GooglePythonStyleGuideCN/refs/heads/master/README.md

代码编写原则

简洁，清晰易懂，最小化实现
条件或循环分支不能超过三层，提前Return以减少分支的出现
变量说明注释、条件或循环分支注释完全
无需向后兼容，避免添加过多功能
先编写测试集，再实现代码
实现测试集后，先询问用户意见，用户确认后才能继续
如非用户要求，无需编写基准测试代码
英文注释，中文文档
完成代码编写后，在文档的框架不变的情况下更新文档，如CLAUDE.md

测试编写原则

精简、干净、快速
核心关键逻辑或算法必须测试
需要加载transformer模型进行验证的测试与无需加载模型的测试分离
无需编写测试集的情况
- UI界面相关的代码
- 过于复杂或耗时的逻辑
- 基准测试相关

关键词说明

确认：用户认同当前的实现方案或测试集实现，即可以开始工作
继续：用户需要你重读上下文，继续未完成的工作

文档更新说明

仅在工程目录变化时，更新此文档的目录说明部分。如需修改其他部分，请先询问，在进行修改。

工程说明

使用UV管理整个工程，pytest用于测试，justfile用于快捷命令，jujutsu用于版本管理。

目录说明

核心模块

mini-nav/main.py — CLI 入口 (Typer)
mini-nav/database.py — LanceDB 单例管理，用于向量存储与检索
mini-nav/feature_retrieval.py — DINOv2 图像特征提取与检索

源代码目录 (mini-nav/)

mini-nav/configs/ — 配置管理 (Pydantic + YAML)
mini-nav/commands/ — CLI 命令 (train, benchmark, visualize, generate)
mini-nav/compressors/ — 特征压缩算法
- hash_compressor.py — 哈希压缩器与训练loss
- pipeline.py — 压缩流水线（整合 DINO 特征提取）
- train.py — 压缩器训练脚本
mini-nav/data_loading/ — 数据加载与合成
- loader.py — 数据加载器
- synthesizer.py — 场景合成器
mini-nav/utils/ — 工具函数
- feature_extractor.py — 特征提取工具
mini-nav/tests/ — pytest 测试集
mini-nav/benchmarks/ — 基准测试 (recall@k)
mini-nav/visualizer/ — Dash + Plotly 可视化应用

数据目录

datasets/ — 数据集目录
outputs/ — 默认输出目录 (数据库、模型权重等)

Python库

详细可查询pyproject.toml或使用uv pip list获取详细的库信息，请基于目前的库实现功能。如需添加新库，请先询问，用户确认后才能使用uv add <package>新增库。

版本管理 (Jujutsu 特有)

本项目使用 Jujutsu (jj) 进行版本控制，并配套 Memorix MCP 作为架构决策与思维轨迹的持久化中心。

技能调用: 必须使用 jujutsu 相关工具技能来执行分支、提交、修改（describe）等操作，禁止直接通过 Shell 执行冗长的 Git 兼容指令。
描述规范 (jj desc):
- 执行 jj desc 时，首行必须是精简的变更标题。
- 空一行后，仅记录改动的核心业务点。
- 语言使用英文进行描述
- 禁忌: 禁止在 jj 描述中堆砌复杂的算法逻辑或长篇的设计决策。
记忆联动 (Memorix 优先):
- 凡涉及架构变更、算法决策或重构逻辑，在执行 jj desc 之前，必须先调用 memorix_store (或对应的添加方法)。
- 关联标记: 在 Memorix 的存储记录中，必须强制包含当前变更的 jj change ID，以便实现从代码变更到思维链的完美映射。
- 检索逻辑: 在处理需要深入理解上下文的任务时，应主动调用 memorix_search 检索相关的历史 change_id 决策。
无感记录原则:
- 严禁在工程目录下生成任何独立的 change_log.md 或 AI 自动化文档。
- 所有关于“为什么这样改”的知识，应当流向 jj 的原子化提交描述或 Memorix 的知识图谱库。

描述示例

refactor(compressors): Simplify module by removing SAM/DINO separation code

- Remove dino_compressor.py and segament_compressor.py
- Rewrite pipeline.py to inline DINO into HashPipeline
- Maintain backward compatibility: SAMHashPipeline alias
- Update tests and benchmark.py

提交步骤

执行jj diff --no-pager获取当前所有更改
根据更改内容，与openspec生成的相关文档进行总结，重点在于更改内容及其决策逻辑
调用记忆功能，如Memorix记忆先前总结的内容
遵循描述规范，使用jj进行更改的描述
执行jj new开启一个新的更改

记忆管理 (Memorix MCP)

本项目使用 Memorix 作为核心上下文引擎，用于存储架构决策、复杂逻辑关联和历史重构原因。

记忆写入准则

主动记录: 在完成以下操作后，必须调用 memorix.store：
- 用户确认后的核心架构变更（例如：LanceDB 的索引策略）。
- 复杂的 bug 修复逻辑（记录“为什么”这么修，防止回滚）。
- 用户在对话中表达的明确偏好（例如：对特定 Python 库的厌恶）。
- 代码的修改及其决策逻辑(例如：对于用户特定需求导致的更改)。
结构化存储: 存储时请使用 [Category: Topic] Description 的格式，确保检索效率。

记忆检索准则

冷启动检索: 每一轮新对话开始或切换到新任务时，优先调用 memorix.search 关键词（如 "project_architecture", "database_schema"），以确保不偏离既有设计。
防止幻觉: 如果对某个旧功能的实现细节不确定，先检索记忆，禁止凭空猜测。

内存与冗余控制

精简描述: 存入 Memorix 的信息必须精简，严禁存入整段代码块，仅存储“逻辑描述”和“决策依据”。
清理逻辑: 发现记忆库中存在与当前代码事实冲突的旧信息时，应主动提示用户进行更新或覆盖。

5.9 KiB Raw Permalink Blame History Unescape Escape