1 år sedan · 7545e5de6c
--- a/api/core/model_runtime/model_providers/nvidia/llm/_position.yaml
+++ b/api/core/model_runtime/model_providers/nvidia/llm/_position.yaml
@@ -1,5 +1,7 @@
 
				 - google/gemma-7b
			
 
				 - google/codegemma-7b
			
 
				 - meta/llama2-70b
			
 
				+- meta/llama3-8b
			
 
				+- meta/llama3-70b
			
 
				 - mistralai/mixtral-8x7b-instruct-v0.1
			
 
				 - fuyu-8b
			
--- a/api/core/model_runtime/model_providers/nvidia/llm/codegemma-7b.yaml
+++ b/api/core/model_runtime/model_providers/nvidia/llm/codegemma-7b.yaml
@@ -11,13 +11,19 @@ model_properties:
 
				 parameter_rules:
			
 
				   - name: temperature
			
 
				     use_template: temperature
			
 
				+    min: 0
			
 
				+    max: 1
			
 
				+    default: 0.5
			
 
				   - name: top_p
			
 
				     use_template: top_p
			
 
				+    min: 0
			
 
				+    max: 1
			
 
				+    default: 1
			
 
				   - name: max_tokens
			
 
				     use_template: max_tokens
			
 
				-    default: 1024
			
 
				     min: 1
			
 
				     max: 1024
			
 
				+    default: 1024
			
 
				   - name: frequency_penalty
			
 
				     use_template: frequency_penalty
			
 
				     min: -2
			
--- a/api/core/model_runtime/model_providers/nvidia/llm/fuyu-8b.yaml
+++ b/api/core/model_runtime/model_providers/nvidia/llm/fuyu-8b.yaml
@@ -22,6 +22,6 @@ parameter_rules:
 
				     max: 1
			
 
				   - name: max_tokens
			
 
				     use_template: max_tokens
			
 
				-    default: 512
			
 
				+    default: 1024
			
 
				     min: 1
			
 
				     max: 1024
			
--- a/api/core/model_runtime/model_providers/nvidia/llm/gemma-7b.yaml
+++ b/api/core/model_runtime/model_providers/nvidia/llm/gemma-7b.yaml
@@ -11,13 +11,19 @@ model_properties:
 
				 parameter_rules:
			
 
				   - name: temperature
			
 
				     use_template: temperature
			
 
				+    min: 0
			
 
				+    max: 1
			
 
				+    default: 0.5
			
 
				   - name: top_p
			
 
				     use_template: top_p
			
 
				+    min: 0
			
 
				+    max: 1
			
 
				+    default: 1
			
 
				   - name: max_tokens
			
 
				     use_template: max_tokens
			
 
				-    default: 512
			
 
				     min: 1
			
 
				     max: 1024
			
 
				+    default: 1024
			
 
				   - name: frequency_penalty
			
 
				     use_template: frequency_penalty
			
 
				     min: -2
			
--- a/api/core/model_runtime/model_providers/nvidia/llm/llama2-70b.yaml
+++ b/api/core/model_runtime/model_providers/nvidia/llm/llama2-70b.yaml
@@ -7,17 +7,23 @@ features:
 
				   - agent-thought
			
 
				 model_properties:
			
 
				   mode: chat
			
 
				-  context_size: 32768
			
 
				+  context_size: 4096
			
 
				 parameter_rules:
			
 
				   - name: temperature
			
 
				     use_template: temperature
			
 
				+    min: 0
			
 
				+    max: 1
			
 
				+    default: 0.5
			
 
				   - name: top_p
			
 
				     use_template: top_p
			
 
				+    min: 0
			
 
				+    max: 1
			
 
				+    default: 1
			
 
				   - name: max_tokens
			
 
				     use_template: max_tokens
			
 
				-    default: 512
			
 
				     min: 1
			
 
				     max: 1024
			
 
				+    default: 1024
			
 
				   - name: frequency_penalty
			
 
				     use_template: frequency_penalty
			
 
				     min: -2
			
--- a/api/core/model_runtime/model_providers/nvidia/llm/llama3-70b.yaml
+++ b/api/core/model_runtime/model_providers/nvidia/llm/llama3-70b.yaml
@@ -0,0 +1,36 @@
 
				+model: meta/llama3-70b
			
 
				+label:
			
 
				+  zh_Hans: meta/llama3-70b
			
 
				+  en_US: meta/llama3-70b
			
 
				+model_type: llm
			
 
				+features:
			
 
				+  - agent-thought
			
 
				+model_properties:
			
 
				+  mode: chat
			
 
				+  context_size: 8192
			
 
				+parameter_rules:
			
 
				+  - name: temperature
			
 
				+    use_template: temperature
			
 
				+    min: 0
			
 
				+    max: 1
			
 
				+    default: 0.5
			
 
				+  - name: top_p
			
 
				+    use_template: top_p
			
 
				+    min: 0
			
 
				+    max: 1
			
 
				+    default: 1
			
 
				+  - name: max_tokens
			
 
				+    use_template: max_tokens
			
 
				+    min: 1
			
 
				+    max: 1024
			
 
				+    default: 1024
			
 
				+  - name: frequency_penalty
			
 
				+    use_template: frequency_penalty
			
 
				+    min: -2
			
 
				+    max: 2
			
 
				+    default: 0
			
 
				+  - name: presence_penalty
			
 
				+    use_template: presence_penalty
			
 
				+    min: -2
			
 
				+    max: 2
			
 
				+    default: 0
			
--- a/api/core/model_runtime/model_providers/nvidia/llm/llama3-8b.yaml
+++ b/api/core/model_runtime/model_providers/nvidia/llm/llama3-8b.yaml
@@ -0,0 +1,36 @@
 
				+model: meta/llama3-8b
			
 
				+label:
			
 
				+  zh_Hans: meta/llama3-8b
			
 
				+  en_US: meta/llama3-8b
			
 
				+model_type: llm
			
 
				+features:
			
 
				+  - agent-thought
			
 
				+model_properties:
			
 
				+  mode: chat
			
 
				+  context_size: 8192
			
 
				+parameter_rules:
			
 
				+  - name: temperature
			
 
				+    use_template: temperature
			
 
				+    min: 0
			
 
				+    max: 1
			
 
				+    default: 0.5
			
 
				+  - name: top_p
			
 
				+    use_template: top_p
			
 
				+    min: 0
			
 
				+    max: 1
			
 
				+    default: 1
			
 
				+  - name: max_tokens
			
 
				+    use_template: max_tokens
			
 
				+    min: 1
			
 
				+    max: 1024
			
 
				+    default: 1024
			
 
				+  - name: frequency_penalty
			
 
				+    use_template: frequency_penalty
			
 
				+    min: -2
			
 
				+    max: 2
			
 
				+    default: 0
			
 
				+  - name: presence_penalty
			
 
				+    use_template: presence_penalty
			
 
				+    min: -2
			
 
				+    max: 2
			
 
				+    default: 0
			
--- a/api/core/model_runtime/model_providers/nvidia/llm/llm.py
+++ b/api/core/model_runtime/model_providers/nvidia/llm/llm.py
@@ -25,7 +25,10 @@ class NVIDIALargeLanguageModel(OAIAPICompatLargeLanguageModel):
 
				         'mistralai/mixtral-8x7b-instruct-v0.1': '',
			
 
				         'google/gemma-7b': '',
			
 
				         'google/codegemma-7b': '',
			
 
				-        'meta/llama2-70b': ''
			
 
				+        'meta/llama2-70b': '',
			
 
				+        'meta/llama3-8b': '',
			
 
				+        'meta/llama3-70b': ''
			
 
				+        
			
 
				     }
			
 
				 
			
 
				     def _invoke(self, model: str, credentials: dict,
			
--- a/api/core/model_runtime/model_providers/nvidia/llm/mistralai_mixtral-8x7b-instruct-v0.1.yaml
+++ b/api/core/model_runtime/model_providers/nvidia/llm/mistralai_mixtral-8x7b-instruct-v0.1.yaml
@@ -11,13 +11,19 @@ model_properties:
 
				 parameter_rules:
			
 
				   - name: temperature
			
 
				     use_template: temperature
			
 
				+    min: 0
			
 
				+    max: 1
			
 
				+    default: 0.5
			
 
				   - name: top_p
			
 
				     use_template: top_p
			
 
				+    min: 0
			
 
				+    max: 1
			
 
				+    default: 1
			
 
				   - name: max_tokens
			
 
				     use_template: max_tokens
			
 
				-    default: 512
			
 
				     min: 1
			
 
				     max: 1024
			
 
				+    default: 1024
			
 
				   - name: frequency_penalty
			
 
				     use_template: frequency_penalty
			
 
				     min: -2
			
--- a/api/core/model_runtime/model_providers/nvidia/nvidia.yaml
+++ b/api/core/model_runtime/model_providers/nvidia/nvidia.yaml
@@ -1,6 +1,9 @@
 
				 provider: nvidia
			
 
				 label:
			
 
				   en_US: API Catalog
			
 
				+description:
			
 
				+  en_US: API Catalog
			
 
				+  zh_Hans: API Catalog
			
 
				 icon_small:
			
 
				   en_US: icon_s_en.svg
			
 
				 icon_large: