Examples and Report Walkthrough

This page walks through real finetuning_architecture sample artifacts and how to interpret results.

Sample Artifacts

Bundled local sample outputs:

crates/arxo-engine/src/metrics/ai_observability/finetuning_architecture/samples/toy-finetune-workflow-report.json
crates/arxo-engine/src/metrics/ai_observability/finetuning_architecture/samples/toy-finetune-workflow-report.md

Sample project and config:

crates/arxo-engine/src/metrics/ai_observability/finetuning_architecture/samples/toy-finetune-workflow/
crates/arxo-engine/src/metrics/ai_observability/finetuning_architecture/samples/finetuning-architecture-config.yaml

From your project directory, run Arxo with the path to your fine-tuning project and config:

arxo analyze \
  --path /path/to/your/finetune-project \
  --config finetuning-architecture-config.yaml \
  --format json \
  --output report.json

These summarize whether the pipeline is broadly healthy before detector-level triage.

Reproducibility: base model pinning, run lineage, determinism envelope, checkpoint-eval linkage.
Data/eval: eval harness maturity, contamination risk, prompt/template-loss consistency, distillation integrity.
Safety/governance: artifact access, trust surface, privacy recordkeeping, provenance.
Operations: OOM controls, cost tracking, checkpoint hygiene, resume safety.

Review findings with rule_id and CodeSpan evidence to prioritize fixes in concrete files/lines.

These help explain operational topology and missing stages.

Signals:

Action order:

Signals:

Action order:

Low score without findings usually means weak evidence density; inspect central training/config files first.
Findings are best used as fix-entry points, while scores are better for release gates and trend tracking.