From dea5dcad36988ae7641e23ea9193ea0537ff113e Mon Sep 17 00:00:00 2001
From: Chummy <chumyin0912@gmail.com>
Date: Wed, 18 Feb 2026 23:08:12 +0800
Subject: [PATCH] fix(onboard): refine nvidia nim onboarding catalogs and docs

---
 docs/commands-reference.md  |  2 ++
 docs/providers-reference.md | 14 +++++++++
 src/onboard/wizard.rs       | 58 +++++++++++++++++++++++++------------
 3 files changed, 55 insertions(+), 19 deletions(-)
diff --git a/docs/commands-reference.md b/docs/commands-reference.md
index 7c53cd7..8c0d3ae 100644
--- a/docs/commands-reference.md
+++ b/docs/commands-reference.md
@@ -71,6 +71,8 @@ Last verified: **February 18, 2026**.
 - `zeroclaw models refresh --provider <ID>`
 - `zeroclaw models refresh --force`
 
+`models refresh` currently supports live catalog refresh for provider IDs: `openrouter`, `openai`, `anthropic`, `groq`, `mistral`, `deepseek`, `xai`, `together-ai`, `gemini`, `ollama`, `astrai`, `venice`, `fireworks`, `cohere`, `moonshot`, `glm`, `zai`, `qwen`, and `nvidia`.
+
 ### `channel`
 
 - `zeroclaw channel list`
diff --git a/docs/providers-reference.md b/docs/providers-reference.md
index e1308c9..ddefb8c 100644
--- a/docs/providers-reference.md
+++ b/docs/providers-reference.md
@@ -59,6 +59,20 @@ Runtime resolution order is:
 - Default onboarding model: `kimi-for-coding` (alternative: `kimi-k2.5`)
 - Runtime auto-adds `User-Agent: KimiCLI/0.77` for compatibility.
 
+### NVIDIA NIM Notes
+
+- Canonical provider ID: `nvidia`
+- Aliases: `nvidia-nim`, `build.nvidia.com`
+- Base API URL: `https://integrate.api.nvidia.com/v1`
+- Model discovery: `zeroclaw models refresh --provider nvidia`
+
+Recommended starter model IDs (verified against NVIDIA API catalog on February 18, 2026):
+
+- `meta/llama-3.3-70b-instruct`
+- `deepseek-ai/deepseek-v3.2`
+- `nvidia/llama-3.3-nemotron-super-49b-v1.5`
+- `nvidia/llama-3.1-nemotron-ultra-253b-v1`
+
 ## Custom Endpoints
 
 - OpenAI-compatible endpoint:
diff --git a/src/onboard/wizard.rs b/src/onboard/wizard.rs
index e4e2432..abc2c31 100644
--- a/src/onboard/wizard.rs
+++ b/src/onboard/wizard.rs
@@ -472,6 +472,7 @@ fn canonical_provider_name(provider_name: &str) -> &str {
         "together" => "together-ai",
         "google" | "google-gemini" => "gemini",
         "kimi_coding" | "kimi_for_coding" => "kimi-code",
+        "nvidia-nim" | "build.nvidia.com" => "nvidia",
         _ => provider_name,
     }
 }
@@ -479,13 +480,7 @@ fn canonical_provider_name(provider_name: &str) -> &str {
 fn allows_unauthenticated_model_fetch(provider_name: &str) -> bool {
     matches!(
         canonical_provider_name(provider_name),
-        "openrouter"
-            | "ollama"
-            | "venice"
-            | "astrai"
-            | "nvidia"
-            | "nvidia-nim"
-            | "build.nvidia.com"
+        "openrouter" | "ollama" | "venice" | "astrai" | "nvidia"
     )
 }
 
@@ -520,7 +515,7 @@ fn default_model_for_provider(provider: &str) -> String {
         "ollama" => "llama3.2".into(),
         "gemini" => "gemini-2.5-pro".into(),
         "kimi-code" => "kimi-for-coding".into(),
-        "nvidia" | "nvidia-nim" | "build.nvidia.com" => "meta/llama-3.3-70b-instruct".into(),
+        "nvidia" => "meta/llama-3.3-70b-instruct".into(),
         "astrai" => "anthropic/claude-sonnet-4.6".into(),
         _ => "anthropic/claude-sonnet-4.6".into(),
     }
@@ -792,22 +787,22 @@ fn curated_models_for_provider(provider_name: &str) -> Vec<(String, String)> {
                 "Qwen Turbo (fast and cost-efficient)".to_string(),
             ),
         ],
-        "nvidia" | "nvidia-nim" | "build.nvidia.com" => vec![
+        "nvidia" => vec![
             (
                 "meta/llama-3.3-70b-instruct".to_string(),
                 "Llama 3.3 70B Instruct (balanced default)".to_string(),
             ),
             (
                 "deepseek-ai/deepseek-v3.2".to_string(),
-                "DeepSeek V3.2 (reasoning + coding)".to_string(),
+                "DeepSeek V3.2 (advanced reasoning + coding)".to_string(),
             ),
             (
-                "google/gemma-3-27b-it".to_string(),
-                "Gemma 3 27B IT (cost-efficient)".to_string(),
+                "nvidia/llama-3.3-nemotron-super-49b-v1.5".to_string(),
+                "Llama 3.3 Nemotron Super 49B v1.5 (NVIDIA-tuned)".to_string(),
             ),
             (
-                "meta/llama-3.1-405b-instruct".to_string(),
-                "Llama 3.1 405B Instruct (max quality)".to_string(),
+                "nvidia/llama-3.1-nemotron-ultra-253b-v1".to_string(),
+                "Llama 3.1 Nemotron Ultra 253B v1 (max quality)".to_string(),
             ),
         ],
         "astrai" => vec![
@@ -881,8 +876,6 @@ fn supports_live_model_fetch(provider_name: &str) -> bool {
             | "zai"
             | "qwen"
             | "nvidia"
-            | "nvidia-nim"
-            | "build.nvidia.com"
     )
 }
 
@@ -907,9 +900,7 @@ fn models_endpoint_for_provider(provider_name: &str) -> Option<&'static str> {
             "glm" => Some("https://api.z.ai/api/paas/v4/models"),
             "zai" => Some("https://api.z.ai/api/coding/paas/v4/models"),
             "qwen" => Some("https://dashscope.aliyuncs.com/compatible-mode/v1/models"),
-            "nvidia" | "nvidia-nim" | "build.nvidia.com" => {
-                Some("https://integrate.api.nvidia.com/v1/models")
-            }
+            "nvidia" => Some("https://integrate.api.nvidia.com/v1/models"),
             "astrai" => Some("https://as-trai.com/v1/models"),
             _ => None,
         },
@@ -4641,6 +4632,10 @@ mod tests {
         );
         assert_eq!(default_model_for_provider("venice"), "zai-org-glm-5");
         assert_eq!(default_model_for_provider("moonshot"), "kimi-k2.5");
+        assert_eq!(
+            default_model_for_provider("nvidia"),
+            "meta/llama-3.3-70b-instruct"
+        );
         assert_eq!(
             default_model_for_provider("nvidia-nim"),
             "meta/llama-3.3-70b-instruct"
@@ -4664,6 +4659,8 @@ mod tests {
         assert_eq!(canonical_provider_name("minimax-cn"), "minimax");
         assert_eq!(canonical_provider_name("zai-cn"), "zai");
         assert_eq!(canonical_provider_name("z.ai-global"), "zai");
+        assert_eq!(canonical_provider_name("nvidia-nim"), "nvidia");
+        assert_eq!(canonical_provider_name("build.nvidia.com"), "nvidia");
     }
 
     #[test]
@@ -4757,6 +4754,9 @@ mod tests {
         assert!(supports_live_model_fetch("google"));
         assert!(supports_live_model_fetch("grok"));
         assert!(supports_live_model_fetch("together"));
+        assert!(supports_live_model_fetch("nvidia"));
+        assert!(supports_live_model_fetch("nvidia-nim"));
+        assert!(supports_live_model_fetch("build.nvidia.com"));
         assert!(supports_live_model_fetch("ollama"));
         assert!(supports_live_model_fetch("astrai"));
         assert!(supports_live_model_fetch("venice"));
@@ -4800,6 +4800,26 @@ mod tests {
             curated_models_for_provider("zai"),
             curated_models_for_provider("zai-cn")
         );
+        assert_eq!(
+            curated_models_for_provider("nvidia"),
+            curated_models_for_provider("nvidia-nim")
+        );
+        assert_eq!(
+            curated_models_for_provider("nvidia"),
+            curated_models_for_provider("build.nvidia.com")
+        );
+    }
+
+    #[test]
+    fn curated_models_for_nvidia_include_nim_catalog_entries() {
+        let ids: Vec<String> = curated_models_for_provider("nvidia")
+            .into_iter()
+            .map(|(id, _)| id)
+            .collect();
+
+        assert!(ids.contains(&"meta/llama-3.3-70b-instruct".to_string()));
+        assert!(ids.contains(&"deepseek-ai/deepseek-v3.2".to_string()));
+        assert!(ids.contains(&"nvidia/llama-3.3-nemotron-super-49b-v1.5".to_string()));
     }
 
     #[test]