refactor(benchmarks): modularize benchmark system with config-driven execution

2026-07-12 20:15:31 +08:00 · 2026-03-02 16:00:36 +08:00
parent a7b01cb49e
commit a16b376dd7
14 changed files with 779 additions and 180 deletions
--- a/mini-nav/configs/models.py
+++ b/mini-nav/configs/models.py
@@ -1,7 +1,7 @@
 """Pydantic data models for feature compressor configuration."""

 from pathlib import Path
-from typing import Optional
+from typing import Literal, Optional

 from pydantic import BaseModel, ConfigDict, Field, field_validator

@@ -98,6 +98,41 @@ class DatasetConfig(BaseModel):
        return v


+class DatasetSourceConfig(BaseModel):
+    """Configuration for benchmark dataset source."""
+
+    model_config = ConfigDict(extra="ignore")
+
+    source_type: Literal["huggingface", "local"] = "huggingface"
+    path: str = Field(default="", description="HuggingFace dataset ID or local path")
+    img_column: str = Field(default="img", description="Image column name")
+    label_column: str = Field(default="label", description="Label column name")
+
+
+class BenchmarkTaskConfig(BaseModel):
+    """Configuration for benchmark task."""
+
+    model_config = ConfigDict(extra="ignore")
+
+    name: str = Field(default="recall_at_k", description="Task name")
+    type: str = Field(default="retrieval", description="Task type")
+    top_k: int = Field(default=10, gt=0, description="Top K for recall evaluation")
+
+
+class BenchmarkConfig(BaseModel):
+    """Configuration for benchmark evaluation."""
+
+    model_config = ConfigDict(extra="ignore")
+
+    enabled: bool = Field(default=False, description="Enable benchmark evaluation")
+    dataset: DatasetSourceConfig = Field(default_factory=DatasetSourceConfig)
+    task: BenchmarkTaskConfig = Field(default_factory=BenchmarkTaskConfig)
+    batch_size: int = Field(default=64, gt=0, description="Batch size for DataLoader")
+    model_table_prefix: str = Field(
+        default="benchmark", description="Prefix for LanceDB table names"
+    )
+
+
 class Config(BaseModel):
    """Root configuration for the feature compressor."""

@@ -106,3 +141,4 @@ class Config(BaseModel):
    model: ModelConfig = Field(default_factory=ModelConfig)
    output: OutputConfig = Field(default_factory=OutputConfig)
    dataset: DatasetConfig = Field(default_factory=DatasetConfig)
+    benchmark: BenchmarkConfig = Field(default_factory=BenchmarkConfig)